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La presente invention concerne notamment I'utilisation d'au moins un 
polypeptide, pour obtenir une composition diagnostique, pronostique, prophylactique ou 
5 therapeutique destinee a detecter, prevenir ou traiter un etat pathologique associe a une 
maladie degenerative et/ou auto-innmune et/ou neurologique. 

Selon r invention, on entend par maladie degenerative, une maladie dans 
laquelle un processus de mort cellulaire ou de destruction cellulaire est associe a des 
troubles physiologiques et/ou cliniques. La maladie d* Alzheimer, la sclerose laterale 

10 amyotrophique, la maladie de Parkinson sont classees parmi les maladies 
neurodegeneratives. On entend par maladie auto-immune, une hyperreactivite du 
systeme immunitaire vis a vis d'un ou de plusieurs auto-antigene(s). La sclerose en 
plaques (SEP), la polyarthrite rhumatoide (PR) et le lupus erythemateux sont classes 
dans les maladies auto-immunes. 

15 La sclerose en plaques est une maladie chronique du systeme nerveux 

central de Thomme, evoluant par succession de phases de remission et de poussee ou 
selon une progression reguliere, dont la caracteristique anatomopathologique consiste en 
la formation de zones de demyelinisation bien delimitees dans la substance blanche du 
cerveau et de la moelle epiniere. 

20 Au niveau histologique, ces zones presentent au stade precoce du 

processus lesionnel, une degradation de la myeline peri-axonale associee a une atteinte 
des cellules gliales responsable de cette demyelinisation. Une activation macrophagique 
inflammatoire impliquant les cellules microgliales (macrophages tissulaires residants du 
systeme nerveux central), ainsi que, probablement, des macrophages provenant de 

25 monocytes sanguins infiltres, est associee a ce processus de demyelinisation et contribue 
a la destruction des feuillets myelinises. Au centre de la zone demyelinisee, une depletion 
relative en cellules gliales est retrouvee alors qu*une proliferation d 'astrocytes se 
developpe a la peripherie et peut envahir la plaque demyelinisee pour generer une plaque 
fibreuse ou gliotique. Ces structures sclerotiques sont a Torigine du nom donne a la 

30 maladie. 
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Une autre caracteristique de ces plaques est leur association quasi 
systematique avec un element vasculaire autour duquel elles se developpent. 

Au niveau histologique, on observe une alteration frequente de la barriere 
hemato-encephalique (BHE) constituee par Tendothelium capillaire. Un des elements 
5 determinants dans le maintien de la BHE est constitue par la presence sous-jacente 
d'extensions cytoplasmiques des astrocytes, appelees pieds astrocytaires. 
Vraisemblablement, les pieds astrocytaires induisent la formation ou permettent le 
maintien de structures de jonction etanches qui assurent la cohesion de la barriere 
endotheliale capillaire concretisant la BHE. Or, differents modeles pathoiogiques font 
10 etat de I'alteration de la BHE et d'une depletion des pieds astrocytaires. 

Par ailleurs, dans le processus lesionnel de la SEP, I'alteration de la BHE 
contribue a amplifier la reponse inflammatoire associee, par I'afHux de cellules 
lymphoides provenant de la circulation sanguine. La contribution de rinflammation 
associee aux cellules immunitaires est importante dans la SEP et participe au processus 
15 lesionneL 

L'etiologie de la SEP est source d*un debat d*actualite car la maladie 
pourrait avoir des origines diverses. Des hypotheses ont ete emises sur une origine 
bacterienne et/ou virale. Par ailleurs, comme decrit dans la demande de brevet 
WO 95/21859, H. Perron et al. ont ete conduits a rechercher un ou des agents efFecteurs 

20 du processus pathogenique aboutissant a la formation typique de plaques de 
demyelinisation et a une gliose astrocytaire. Dans le cadre de cette etude, lis ont mis en 
evidence la presence dans le liquide cephalorachidien (LCR) et le serum de patients SEP 
d'au moins un facteur qui presente une activite toxique vis a vis des cellules 
astrocytaires et oligodendrocytaires humaines ou animates. Cette activite toxique se 

25 caracterise par une desorganisation cytomorphologique du reseau de filaments 
intermediaires et/ou une degradation des proteines desdits filaments et/ou une mort 
cellulaires par apoptose des cellules gliales. lis ont dtabli une correlation significative 
entre la detection in vitro de cette activite toxique dans des echantillons de LCR et de 
serum de patients SEP et la sclerose en plaques par un dosage colorimetrique quantitatif 

30 au bromure de methyltetrazolium (MTT) des cellules vivantes, comme decrit dans la 
demande de brevet WO 95/21859. Par ailleurs, C. Malcus-Vocanson e( al. ont montre 
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que I'urine est un fluide biologique tres favorable pour la detection de Pactivite de ce 
facteur toxique et developpe un procede utilisant la cytometrie de flux pour detecter 
et/ou quantifier les cellules gliales adherentes mortes par apoptose. Toutes les 
informations concemant ce procede sont decrites dans la demande de brevet 
5 WO 98/1 1439, dont le contenu est incorpore a titre de reference. 

Des essais ont ete realises a partir d*une fraction proteique de LCR et 
d'urine de patients SEP pour tenter d'identifier ce facteur toxique. Le contenu proteique 
de chaque fraction a ete separe sur gel SDS-PAGE 12 % et observe apres coloration du 
gel a I'argent. Parmi les proteines observees, une fraction proteique centree sur un poids 

10 moleculaire apparent d'environ 21 kD a ete trouvee minoritairement associee a Pactivite 
toxique deiectee in viiro et une fraction centree sur un poids moleculaire apparent 
d'environ 17 kD a ete trouvee majoritairement associee a cette activite toxique. 

Une injection de la fraction provenant de LCR de patients SEP dans le 
cerveau de rat Lewis et une observation histologique post-mortem de coupes de cerveau 

15 des rats a permis d' observer, trois mois apres T injection, une apoptose de la population 
astrocytaire et la formation de plaques de demyelinisation. Toutes les informations sont 
contenues dans la demande de brevet WO 97/33466, dont le contenu est incorpore a 
titre de reference. Ces observations sont conformes a celles qui ont pu etre faites sur des 
coupes de cerveau de patients atteints de SEP, apres biopsie (N. Benjelloun et al. Cell. 

20 Mol, Biol., 1998, 44 (4), 579-583). 

Les presents inventeurs ont maintenant identifie et analyse les proteines 
associees a cette activite toxique vis a vis des cellules gliales dans des echantillons 
biologiques de patients SEP, en particulier dans Purine, le liquide cephalo-rachidien et le 
serum. 

25 Apres purification des proteines et separation sur gel SDS-TRICINE, les 

inventeurs ont mis en evidence la presence de quatre bandes d'interet de different s poids 
moleculaires apparents, respectivement de 8, 14, 18 et 20 kD correspondant a au moins 
cinq families de proteines difFerentes. Les proteines de ces families ont ensuite ete 
analysees par spectrometrie de masse et/ou sequenpage et recherche d'homologie dans 

30 les banques de donnees (NCBI http :/ww. ncbi.nlm.nih.gov, Basic Blast Search, Protein 
Blastp, les sequences proteiques sont entrees en format FASTA dans la base de donnees 




nr, I'algorithme utilise est Matrix BLOSUM62, I'identite denommee « Identities » 
correspond au nombre d'acides amines identiques donne en pourcentage et la positivite 
« Positives » correspond aux acides amines presentant une equivalence biologique selon 
les parametres sus-mentionnes du logiciel donnes en pourcentage). Ces proteines 
5 appartiennent aux families des proteines du Perlecan, du precurseur de la proteine 
plasmatique de liaison au retinol, du precurseur de Tactivateur du ganglioside GM2, de 
la calgranuline et de la saposine B. Plus precisement, les proteines sont (1) pour la bande 
de 20 kD le fragment C-termina! du Perlecan qui commence a Pacide amine 3464 et se 
termine a I'acide amine 3707 (Murdoch AD et al. J Biol Chem, 1992, April 25 ;267 

10 (12) :8544-47), et reference dans IMdentificateur de sequences SEQ ID N° 2 (la proteine 
entiere Perlecan etant referencee en SEQ ID N°l), (ii) pour la bande de 20 kD le 
precurseur de la proteine plasmatique de liaison au retinol (Monaco HL et al, Science, 
1995, 268 (5213) : 1039-1041) dont la sequence est donnee en SEQ ID N° 4, (iii) pour 
la bande de 18 kD le precurseur de Tactivateur du ganglioside GM2 (Furst W et al., 

15 Euro J Biochem, 1990, Sep 24 ; 193(3) :709-14) identifie en SEQ ID N** 8, (iv) pour la 
bande de 14 kD la calgranuline B (Lagasse E et al.. Mo! Cell Biol, 1988, 
Jun ;8(6) :2402-10) identifiee en SEQ ID N** 17 et (v) pour la bande de 8 kD la saposine 
B (Kleinschmidt T et al., Biol Chem Hoppe Seyler. 1988. Dec ;369(12) :1361-5J 
representee en SEQ ID N° 24. lis ont par ailleurs mis egalement en evidence la presence 

20 de sequences variantes auxdites sequences de reference, en particulier pour la bande de 
18 kD une sequence variante du precurseur de Pactivateur du ganglioside GM2 
referencee SEQ ID N'' 9. Ces sequences proteiques variantes sont le produit de 
mutations au niveau des genes codant pour lesdites proteines ou sont le resultats de 
phenomenes d'epissage. II est a noter par exemple que la calprotectine est un variant de 

25 la calgranuline B. 

Le fragment C-termina! de !a proteine Perlecan (SEQ ID N** 2) est codee 
par exemple par !a sequence nucleotidique ADN SEQ ID N° 69, en tenant compte du 
code genetique. La proteine precurseur de la proteine plasmatique de liaison au retino! 
30 (SEQ ID N*' 4) est codee par exemple par la sequence nucleotidique ADN SEQ ID 
N° 70, en tenant compte du code genetique. La proteine activatrice du GM2 (SEQ ID 



N° 8) est codec par example par la sequence nucleotidique ADN SEQ ID 31, en 
tenant compte du code genetique. Les peptides FSWDNCFEGK DPAVIR et YSLPKSEFAV 
PDLELP issus du polypeptide mute activateur du GM2 (SEQ ID N°9) sont codes par les 
sequences nucleotidiques ADN SEQ ID N° 66 et SEQ ID N° 67 respectivement, en 
5 tenant compte du code genetique. La proteine calgranuline B (SEQ ID N° 17) est codee 
par exemple par la sequence nucleotidique ADN SEQ ID N° 42, en tenant compte du 
code genetique. La proteine saposine B (SEQ ID N° 24) est codee par exemple par la 
sequence nucleotidique ADN SEQ ID N° 53, en tenant compte du code genetique. 

Par famille de proteines on entend 1' ensemble des proteines codecs a partir 

10 d'un meme gene d*ADN et qui resultent d'un multi-epissage difFerentiel du gene et/ou 
d'un cadre de lecture different. Le gene ADN est transcrit avec des phenomenes 
d'epissage alternatif ce qui conduit a la traduction de differentes sequences primaires de 
proteines. Toutes ces proteines appartiennent a une meme famille proteique. On inclut 
egalement dans le terme « famille proteique », les proteines qui presehtent au moins 

15 70% d'identite, de preference au moins 80 % d'identite et avantageusement au moins 98 
% d'identite avec une sequence proteique de reference de la famille. 

On entend par multi-epissage, un epissage intervenant au moins une fois 
dans la region nucleotidique d'interet. 

Par exemple, par famille de proteine precurseur de la proteine plasmatique 

20 de liaison au retinol, on designe la famille de proteines comprenant au moins les 
proteines ou fragment de proteines de sequence SEQ ID N° 4, SEQ IDN° 5, SEQ ID 
N° 6, SEQ ID N** 7, et les proteines codecs par le gene correspondant scion differents 
cadres de lecture. 

Par exemple, par famille de proteine activatrice du GM2, on designe la 
25 famille de proteines comprenant au moins les proteines ou fragments de proteines de 
sequence SEQ ID N° 8. SEQ ID N° 9, SEQ ID N° 10, SEQ ID N** 1 1, SEQ ID NM2, 
SEQ ID N° 13, SEQ ID N° 14. SEQ ID N° 15, SEQ ID N** 16, et les proteines codecs 
par le gene correspondant selon differents cadres de lecture, qui resultent d*un multi- 
epissage differentiel du gene et/ou d'un cadre de lecture different. 
30 Par exemple, par famille de proteine calgranuline B, on designe la famille 

de proteines comprenant au moins les proteines ou fragments de proteines de sequence 
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SEQ ID N° 17, SEQ ID N° 18, SEQ ID N° 19, SEQ ID N° 20. SEQ ID N° 21, SEQ ID 
N° 22, SEQ ID N° 23, et les proteines codecs par le gene correspondant selon difFerents 
cadres de lecture, qui resultent d'un multi-epissage differentiel du gene et/ou d'un cadre 
de lecture different. Les proteines MRP 14 (SEQ ID N° 17) et 1VIRP8 (SEQ ID N° 18) 
5 ont une sequence proteique differente tout en etant codees par un meme gene ; elles 
appartiennent a la meme famille proteique. 

Par exemple, par famille de proteine saposine B, on designe la famille de 
proteines comprenant au molm les proteines ou fragments de proteines de sequence 
SEQ ID N° 24, SEQ ID N° 25, SEQ ID N*^ 26, SEQ ID N° 27. SEQ ID N° 28, SEQ 
10 IDN** 29, et les proteines codees par le gene correspondant selon difFerents cadres de 
lecture, qui resultent d'un multi-epissage differentiel du gene et/ou d'un cadre de lecture 
different. 

Par famille d'acides nucleiques codant pour une proteine on entend 
Tensembie des sequences nucleiques ADNc et/ou ARN transcrits a partir d'un meme 
15 gene ADN et, qui resultent d'un multi-epissage differentiel. Le gene ADN est transcrit 
avec des phdnomenes d'epissage differentiels et conduit a la synthase de differents 
acides nucleiques (ADNc, ARN) de sequences differentes. Toutes ces sequences ADNc 
et ARNm sont considerees comme appartenant a une meme famille d'acides nucleiques. 

Par exemple, par famille d'acides nucleiques codant pour la famille de 
20 proteine precurseur de la proteine plasmatique de liaison au retinol, on designe la famille 
d'acides nucleiques comprenant av moins les acides nucleiques ou fragments de 
sequence SEQ ID N°30. 

Par exemple, par famille d'acides nucleiques codant pour la famille de 
proteine activatrice du GM2, on designe la famille d'acides nucleiques comprenant au 
25 moins les acides nucleiques ou fragments de sequences SEQ ID N** 3_1, SEQ ID N° 32, 
SEQ ID N*' 33, SEQ ID N** 34, SEQ ID N° 35, SEQ ID N** 36, SEQ ID N° 37, SEQ ID 
N** 38, SEQ ID N^ 39. SEQ ID N** 40, SEQ ID N** 41 qui resultent d'un multi-epissage 
differentiel du gene et/ou d'un cadre de lecture different. 

Par exemple, par famille d'acides nucleiques codant pour la famille de 
30 proteine calgranuiine B, on designe la famille d'acides nucleiques comprenant av moins 
les acides nucleiques ou fragments de sequences SEQ ID 42, SEQ ID N° 43, SEQ 



t. 
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ID N° 44. SEQ ID N° 45, SEQ ID 46. SEQ ID N*^ 47, SEQ ID N° 48, SEQ ID N° 
49, SEQ ID 50, SEQ ID N° 51, SEQ ID N° 52 qui resultent d'un multi-epissage 
difFerentiel du gene et/ou d'un cadre de lecture different. 

Par exemple, par famille d'acides nucleiques codant pour la famille de 
5 proteine saposine B, on designe la famille d'acides nucleiques comprenant ou moins les 
acides nucleiques ou fragment de sequences SEQ ID N'' 53, SEQ ID N° 54, SEQ IDN** 
55 qui resultent d'un multi-epissage differentiel du gene et/ou d'un cadre de lecture 
different. 

Par « epissage » on entend un mecanisme d'excision des introns et de 
10 raboutage des exons au cours de la maturation des transcrits et par « epissage 
differentiel » on entend T existence de plusieurs schemas d 'epissage d'un transcrit 
primaire aboutissant a la formation de differents ARN messagers et, pouvant donner lieu 
a la synthese de plusieurs proteines differentes (Kaplan et Delpech, Biologic Moleculaire 
et Medecine, 1993, 2'""' edition, Medecine et Sciences, Flammarion, pages 73-77). CE 
15 phenomene est largement decrit dans la litterature scientifique. A titre d' exemple, on 
peut citer le modele des genes qui cedent pour les chaTnes lourdes et legeres des 
immunoglobulines, le modele du gene de la dystrophine, le modele du gene de I'alpha 
amylase, le gene de la myeline, etc... 

II est connu que les genes eucaryotes, notamment, comprennent des regions (exons) qui 
to codent pour des fragments de la proteine codec par ledit gene et d'auties regions 
(introns) qui n'ont pas d'^quivalent prot^ique. Ceci est du au fait que lesgenes sont 
d'abord transcrits en un ARN « primaire » qui est ensuite coupe par des enzymes 
d'^pissage au niveau de sites nucl6otidiques speciques (sites d'^pissage). Ces enzymes 
raboutent ensuite les regions codant pour la proteine, reconstituant ainsi un ARN 
Z5 « secondaire » dont les regions introniques ont ete eliminees. Par ailleurs, selon les 
phenotypes cellulaires (et done les tissus ou la dififerenciation) ces enzymes ne sont pas 
toutes exprimees et, ainsi, un meme ARN peut etre episse differemment dans les 
cellules d'un meme individu, generant ainsi des proteines avec des differences de 
sequence . Cependant, ces ph^nomenes peuvent aussi s'appliquer a des regions 
3c nucleotidiques qui sont entidrement codantes (exons), mais qui, selon differents 
epissages possibles vont gen6rer plusieurs proteines differentes a partir de la meme 
region nucleotidique, par phenomene d'epissage differentiel entre les differents produits 
proteiques. 
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plusieurs codons initiateurs de traduction dans plusieurs phases de lecture et/ou un 
epissage d'ARN primaire raboutant des sequences nucleotiques presentes dans des 
phases de lectures differentes sur I'ADN, permet a une meme region ADN de generer 
des produits proteiques sans rapports entre eux, du point de vue de la sequence 
peptidique. 

Enfin, le polymorphisme genetique existant entre les individus d'une meme esp^ce 
et/ou des mutations individuelles peuvent creer ou supprimer des sites d'epissage dans 
une region ADN donnee et, ainsi, modifier la sequence et la structure du ou des 
produits proteiques normalement produits par cette region. 

Ainsi, la combinaison de ces differents phenomenes peut permettre qu'une meme 
sequence nucleotidiquue correspondant a un segment d'ADN, identifiee comme 
determinant une region genetique d'interet dans une etude donnee, comprenne 
I'information necessaire et suffisante pour defmir toute une famille d'ARN episses 
selon des sch6mas differentiels et altematifs, dans des cadres de lecture divers et, par la 
6videmment, de prot^ines et de polypeptides ayant des sequences « mosai'ques » selon 
un cadre de lecture voire selon les trois cadres potentiels et des mutations 
eventuellement liees au polymorphisme genetique. 

Un exemple de ce ph^nomene peut etre represent^ par la region nucleotidique du g6ne 
env du retrovirus HIV-1. En effet, plusieurs prot^ines differentes sont codecs par des 
segments de la meme sequence : par exemple, la giycoproteine d'enveloppe, et les 
proteines regulatrices TAT, REV, NEF, VIF, 

II est encore connu que des proteines peuvent resulter de 1' assemblage de sous-unite 
identiques (homodimeres, homomultimeres) ou differentes (heterodimeres, 
h^tdromultim^res). Ainsi, les differents produits proteiques codes par une meme region 
ADN peuvent aussi s'aasembler entre eux pour constituer des entites proteiques 
complexes multimeriques. Ce ph^nomene s^ajoute aux precedents et, lorsqu'une 
proteine est identifiee par un fragment peptidique, on peut logiquement identifier tous 
les autres elements constitutifs de cette proteine complexe et les segments ADN et 
ARN episse qui les codent, ainsi que tous les membres de la famille de produits 
proteiques et leurs assemblages. 

Un autre exemple est foumi par la region d'ADN humain codant pour la famille de 
proteines MRP 14 ou calgranuline B, MRP8, calprotectine, psoriasine etc.. 
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Aussi la presente invention a pour objet I'utilisation d'au moms un 
polypeptide comprenant au moins un fragment d'une proteine pour obtenir une 
composition diagnostique, pronostique, prophylactique ou therapeutique destinee a 
detecter, pronostiquer, prevenir ou trailer un etat pathologique associe a une maladle 
5 degenerative et/ou auto-immune, ladite proteine etant choisie parmi les proteines dont la 
sequence peptidique a Tetat natif correspond a SEQ ID N° 1, SEQ ID N° 2, SEQ ID N° 
3, SEQ ID 4, SEQ ID N° 5, SEQ ID 6. SEQ ID N*^ 7, SEQ ID 8, SEQ ID N** 
10, SEQ ID 1, SEQ ID 12, SEQ ID 13, SEQ ID N° 14, SEQ ID N"^ 15, 
SEQ ID N° 16, SEQ ID N° 17, SEQ ID 18, SEQ ID N** 19, SEQ ID N** 20, SEQ ID 

10 N° 21, SEQ ID 22. SEQ ID N° 23, SEQ ID 24, SEQ ID 25, SEQ ID 26, 
SEQ ID N'' 27, SEQ ID N*" 28 et SEQ ID 29 et les sequences peptidiques qui 
presentent au moins 70 % d' id entile, de preference au moins 80 % d'identite et 
avantageusement au moins 98 % d'identite avec Tune quelconque des sequences 
peptidiques precitees, et les sequences peptidiques ou les fragments desdites sequences 

15 appartenant a une meme famille de proteines choisies parmi le perlecan, !e precurseur de 
la proteine plasmattque de liaison au retinol, du precurseur de Tactivateur du ganglioside 
GM2, de la calgranutine B et de la saposine B. Dans des modes de realisation 
particuliers au moins deux polypeptides precites sont utilises en combinaison pour 
obtenir une composition diagnostique, pronostique, prophylactique ou therapeutique 

20 destinee a detecter, pronostiquer, prevenir ou traiter un etat pathologique associe a une 
maladie degenerative et/ou auto-immune. 

L*invention concerne egalement I'utilisation d'au moins un polypeptide 
comprenant au moins un fragment d*une proteine pour obtenir une composition 
diagnostique, pronostique, prophylactique ou therapeutique destinee a detecter, 

23 pronostiquer, prevenir ou traiter un etat pathologique associe a une maladie 
degenerative et/ou auto-immune, ladite proteine etant choisie parmi les proteines dont la 
sequence peptidique a Tetat natif correspond a SEQ ID N** 2 , SEQ ID N° 4, SEQ ID 
N° 8, SEQ ID N° 17 et SEQ ID N° 24 et les sequences peptidiques qui presentent au 
moins 70 % d'identite, de preference au moins 80 % d'identite et avantageusement au 

30 moins 98 % d'identite avec Tune quelconque des sequences peptidiques precitees. 
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le avant rectification 



Avantageusement les cinq polypeptides qui repondent a la definition precedente sont 
utilises en combinaison. 

De preference, la sequence peptidique dudit polypeptide connprend, ou 
consiste en une sequence choisie parmi I*une queJconque des SEQ ID N° 2, SEQ ID N° 
5 4, SEQ ID N° 8, SEQ ID NM7 et SEQ ID N** 24. 

L' invention concerne encore 1' utilisation d'au moins un fragment d'un des 
polypeptiques precites pour la preparation d*un peptide immunogene, ledit peptide 
comprenant tout ou partie d'au moins une des sequences referencees SEQ ID N°s 58 a 
65 et etant utilise pour la production d*anticorps monoclonaux. 

10 L 'invention a egalement pour objet, I 'utilisation d'au moms un fragment 

nucleotidique, pour obtenir une composition diagnostique, pronostique, prophylactique 
ou therapeutique destinee a detecter, pronostiquer, prevenir ou traiter un etat 
pathologique associe a une maladie degenerative et/ou auto-immune, selon laquelle ledit 
fragment nucleotidique est choisi parmi des fragments qui cedent pour au moins un 

15 fragment d*une proteine, ladite proteine etant choisie parmi les proteines dont la 
sequence peptidique a Tetat natif correspond a SEQ ID N** 1, SEQ ID N*' 2, SEQ ID N° 
3, SEQ ID N° 4, SEQ ID N*' 5, SEQ ID N'' 6, SEQ ID N** 7, SEQ ID N° 8, SEQ ID N*' 
10, SEQ ID N° 11, SEQ ID N** 12, SEQ ID 13, SEQ ID N** 14, SEQ ID N'' 15, 
SEQ ID N** 16, SEQ ID N° 17, SEQ ID N° 18, SEQ ID N° 19, SEQ ID N° 20, SEQ ID 

20 N° 21, SEQ ID N° 22, SEQ ID N° 23, SEQ ID N° 24, SEQ ID N° 25, SEQ ID N° 26, 
SEQ ID N° 27, SEQ ID N° 28 ET SEQ ID N° 29 et les sequences peptidiques qui 
presentent au moins 70 % d'identite, de preference au moins 80 % et avantageusement 
au moins 98 % d'identite avec Tune quelconque des sequences peptidiques ci dessus, et 
les fragments complementaires desdits fragments, et les sequences peptidiques ou les 

25 fragments desdttes sequences appartenant a une meme famtlle de proteines choisies 
parmi le perlecan, le pr^curseur de la proteine plasmatique de liaison au retinal, du 
precurseur de Tactivateur du ganglioside GM2, de la calgranuline B et de la saposine B. 
II est a ia portee de Thomme du metier de determiner les sequences nucleiques des 
fragments nucleotidiques a partir des sequences peptidiques et du code genetique, ceci 

30 faisant partie de ses connaissances generales. 
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De preference, ledit fragment nucleotidique code pour une proteine qui a 
Tetat natif consiste en une sequence choisie parmi Tune quelconque des SEQ ID N°s 1 a 
8 et SEQ ID N'^s 10 a 29 precitees, et parmi les sequences peptidiques ou les fragments 
desdites sequences appartenant a une meme famille de proteines choisies parmi le 
5 perlecan, le precurseur de la proteine plasmatique de liaison au retinol, du precurseur de 
I'activateur du ganglioside GM2, de la calgranuline B et de la saposine B. 



Un autre objet de I'invention est Tutilisation d*au moins un fragment 
nucleotidique pour obtenir une composition diagnostique, pronostique, prophylactique 

10 ou therapeutique destinee a detecter, pronostiquer, prevenir ou traiter un etat 
pathologique associe a une maladie degenerative et/ou neurologique et/ou auto-immune 
selon laquelle ledit fragment est un fragment d'une sequence nucleique choisie parmi 
rune quelconque des SEQ ID N° 30, SEQ ID N° 31, SEQ ID N° 32, SEQ ID N° 33, 
SEQ ID N° 34, SEQ ID N° 3 5, SEQ ID N° 36, SEQ ID N° 37, SEQ ID N*^' 38, SEQ ID 

15 N° 39, SEQ ID N° 40, SEQ ID N° 41, SEQ ID N° 42, SEQ ID N° 43, SEQ ID N° 44, 
SEQ ID N° 45, SEQ ID N° 46 et SEQ ID N° 47, SEQ ID N° 48, SEQ ID N° 49 et SEQ 
ID N*' 50, SEQ ID N° 51. SEQ ID N° 52, SEQ ID N° 53, SEQ ID N° 54, SEQ ID N° 
55, SEQ ID N'' 56, SEQ ID N° 57, SEQ ID N« 67, SEQ ID 68, SEQ ID 69, 
SEQ ID N'' 70 et SEQ ID N° 71 et leurs sequences comptementaires. 

20 

L'invention concerne egalement Tutilisation d'un ligand specifique d*un 
polypeptide ou d'un fragment nucleotidique tel que defini ci dessus pour obtenir une 
composition diagnostique, pronostique, prophylactique ou therapeutique destinee a 
detecter, pronostiquer, prevenir ou traiter un etat pathologique associe a une maladie 

25 degenerative et/ou auto-immune. 

Par ligand, on entend toute molecule susceptible de s'associer au 
polypeptide, tel que un anticorps monoclonal, un anticorps polyclonal, un recepteur. un 
substrat d'activite enzymatique, une enzyme dont ledit polypeptide est un co-facteur. La 
production d'anticorps polyclonaux et monoclonaux fait partie des connaissances 

30 generales de I'homme du metier. On peut citer a titre de reference Kohler G. et Milstein 
C. (1975) : Continuous culture of fused cells secreting antibody of predefined 
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specificity. Nature 256 :495-497 et Galfre G. et al. (1977) Nature, 266 : 522-550 pour 
la production d'anticorps monoclonaux et Roda A., Bolelli G.F. : Production of high- 
titer antibody to bile acids. Journal of Steroid Biocliemistry, Vol. 13, pp 449-454 (1980) 
pour la production d'anticorps polyclonaux. 
5 Par ligand, on entend egalement toute molecule susceptible de s'associer a 

un fragment nucleotidique, tel qu'un fragment nucleotidique partiellement ou totalement 
complementaire, un polynucleotide compiementaire, un anticorps anti-acides nucleiques. 
La production de fragments nucleotidiques ou de polynucleotides fait partie des 
connaissances generales de Thomme du metier. On peut notamment citer I'utilisation 

10 d 'enzymes de restriction, et la synthese chimique sur synthetiseur automatique, par 
exemple sur des synthetiseurs commercialises par la societe Applied Biosystem. Par 
ailleurs, on connaTt des techniques pour la production d*anticorps anti-acides nucleiques. 
On peut citer a titre d'exemples Philippe Cros et al.. Nucleic Acides Researc, 1994, Vol. 
22, N°. 15, 2951-2957 ; Anderson, W.F. et al. (1988) Bioessays, 8 (2), 69-74 ; Lee, J.S. 

15 et al. (1984) FEBS Lett., 168, 303-306 ; Malfoy, B. et al. (1982) Biochemistry, 21(22), 
5463-5467 ; Stollar, B.D. et al., J.J. (eds) Methods in Enzymology, Academic Press, pp 
70-85 ; Traincard, F. et al. (1989) J. Immunol. Meth., 123, 83-91 et Traincard. F. et al. 
(1989) Mol. Cell. Probes, 3, 27-38). 

L'invention a encore pour objet un procede pour detecter au moins une 

20 protdine associee a une maladie degenerative et/ou auto-immune, dans un echantillon 
biologique dans lequel on met en contact ! 'echantillon biologique avec au moins un 
ligand specifique d*au moins un polypeptide, ledit polypeptide comprenant au moins un 
fragment d*une proteine et ladite proteine etant choisie parmi les proteines dont la 
sequence peptidique a Tetat natif correspond a SEQ ID N° 1, SEQ ID N° 2, SEQ ID N° 

25 3, SEQ ID N° 4, SEQ ID N° 5, SEQ ID N° 6, SEQ ID N° 7, SEQ ID 8, SEQ ID N^ 
10, SEQ ID N° 11, SEQ ID N° 12, SEQ ID N° 13, SEQ ID N^ 14, SEQ ID N° 15, 
SEQ ID W 16, SEQ ID NM7, SEQ ID N** 18, SEQ ID N** 19. SEQ ID N** 20, SEQ ID 
N** 21, SEQ ID N° 22. SEQ ID N** 23. SEQ ID N*' 24. SEQ ID N*' 25, SEQ ID N^ 26. 
SEQ ID N° 27, SEQ ID N** 28 et SEQ ID N** 29 et les sequences peptidiques qui 

30 presentent au moins 70 % d'identite de preference au moins 80 % d'identite et 
avantageusement au moins 98 d*identite avec Tune quelconque des sequences 
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peptidiques SEQ ID N° 1 a SEQ ID N° 8 et SEQ ID N° 10 a 29, et les sequences 
peptidiques ou les fragments desdites sequences appartenant a une meme famille de 
proteines choisies parmi le perlecan, le precurseur de la proteine plasmatique de liaison 
au retinol, du precurseur de I'activateur du ganglioside GM2, de la calgranuline B et de 
5 la saposine B, puis on detecte la formation d'un complexe entre ledit polypeptide et ledit 
ligand. Ledit ligand est avantageusement un anticorps monoclonal, un anticorps 
polyclonal, un recepteur, un substrat d'activite enzymatique ou une enzyme dont ledit 
polypeptide est un cofacteur. 

10 De meme, Tinvention concerne un precede pour detecter au moins un 

ligand associe a une maladie degenerative er/ou auto-immune, dans un echantillon 
biologique, caracterise en ce que Ton met en contact rechantillon biologique avec au 
moins un polypeptide comprenant au moins un fragment d'une proteine, ladite proteine 
etant choisie parmi les proteines dont la sequence peptidique a I'etat natif correspond a 

15 SEQ ID 1, SEQ ID N° 2, SEQ ID N° 3, SEQ ID 4, SEQ ID N° 5, SEQ ID N° 6, 
SEQ ID 7, SEQ ID N° 8, SEQ ID N° 10, SEQ ID N° 11, SEQ ID N*' 12, SEQ ID 
N*' 13. SEQ ID N° 14, SEQ ID N** 15, SEQ ID N*' 16, SEQ ID 17, SEQ ID N** 18, 
SEQ ID N° 19, SEQ ID N° 20, SEQ ID N° 21, SEQ ID N° 22, SEQ ID N« 23, SEQ ID 
N** 24, SEQ ID N** 25. SEQ ID N° 26, SEQ ID N« 27, SEQ ID N° 28 et SEQ ID N*' 29 

20 et les sequences peptidiques qui presentent au moins 70 % d*identite, de preference au 
moins 80 % d'identite et avantageusement au moins 98 % dMdentite avec Tune 
quelconque des sequences peptidiques SEQ ID N° 1 a SEQ ID N° 8 et SEQ ID N**s 10 
a SEQ ID N° 29, et les sequences peptidiques ou les fragments desdites sequences 
appartenant a une meme famille de proteines choisies parmi le perlecan, le precurseur de 

25 la proteine plasmatique de liaison au retinol, du precurseur de I'activateur du ganglioside 
GM2, de la calgranuline B et de la saposine B, puis on detecte la formation d'un 
complexe entre ledit polypeptide et ledit ligand. Le ligand est toute molecule qui repond 
aux conditions pr^cedemment decrites. 

De preference, dans les procedes decrits ci dessus la sequence du 

30 polypeptide comprend ou consiste en une sequence peptidique choisie parmi Tune 
quelconque des SEQ ID N** 1 a 8 et SEQ ID N** 10 a 29 precedentes et les sequences 
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^1 





peptidiques ou ies fragments desdites sequences appartenant a une meme famille de 
proteines choisies parmi le perlecan, le precurseur de la proteine plasmatique de liaison 
au retinol, du precurseur de I'activateur du ganglioside GM2. de la caigranuline B et de 
la saposine B. 



moins un fragment d*une proteine dont la sequence peptidique correspond a SEQ ID N° 
9, ledit fragment presentant au moins une mutation, en particulier au moins deux 
mutations par rapport a la sequence de reference SEQ ID N° 8. Le polypeptide est 
avantageusement choisi parmi les polypeptides qui comprennent la sequence en acides 

10 amines FSWDNCFEGKDPAVIR, referencee SEQ ID N" 68 et la sequence en acides 
amines YSLPKSEFAVPDLELP, referencee SEQ ID 69. 

En particulier, ledit polypeptide comprend ou consiste en SEQ ID N° 9. Ce 
polypeptide est utilise pour obtenir une composition diagnostique, pronostique, 
prophylactique ou therapeutique destinee a detecter, pronostiquer, prevenir ou traiter un 

15 etat pathologique associe a une maladie degenerative et/ou auto-immune, seui ou en 
melange avec au moins un polypeptide tel que defmi precedemment. 

L'un des objet de Tinvention est egalement un fragment nucleotidique qui 
code pour le fragment de la proteine dont la sequence peptidique correspond a SEQ ID 
N° 9, ledit fragment de ladite proteine presentant au moins une mutation, en particulier 

20 deux mutations par rapport a la sequence de reference SEQ ID N° 8. Ledit fragment 
nucleotidique, en particulier, comprend ou consiste en un fragment qui code pour SEQ 
ID N° 9. Ce fragment est utilise pour obtenir une composition diagnostique, 
pronostique, prophylactique ou therapeutique destinee a detecter, prevenir ou traiter un 
etat pathologique associe a une maladie degenerative et/ou auto-immune, seul ou en 

25 melange avec au moins un fragment nucleotidique tel que defini precedemment. 

LMnvention a aussi pour objet un procede pour detecter au moins un ligand 
associe a une maladie degenerative et/ou auto-immune, dans un echantillon biologique, 
selon lequel on met en contact Techantillon biologique avec au moins le polypeptide qui 
comprend ou consiste en SEQ ID N° 9 ou un melange de polypeptides comprenant ce 

30 polypeptide et au moins un polypeptide tel que decrit ci dessus, puis on detecte la 
formation d'un complexe ou de complexes entre le ou les polypeptides et le ou les 
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L' invention concerne egalement un nouveau polypeptide qui comprend au 
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ligands correspondants ; etant entendu que par ligand on entend une molecule qui 
repond aux conditions precitees. 

L'invention concerne egalement un precede pour detecter au moins le 
polypeptide reference SEQ ID N*^ 9 ou un fragment dudit polypeptide, ce fragment 
5 comprenant au moins une et de preference deux mutations par rapport a la sequence de 
refernce SEQ ID N°8, dans un echantillon biologique seion lequel on met en contact 
Techantillon biologique avec au moins un ligand specifique dudit polypeptide, puis on 
detecte la formation d'un complexe entre ledit polypeptide et ledit ligand. La defmition 
de ligand correspond a celle d6fmie precedemment. U peut s'agir entre autres d'un 

10 anticorps monolonal , d'un anticorps polyclonal, d'un substrat d'activite enzymatique, 
ou d'une enzyme dont ledit polypeptide est un cofacteur. d'un recepteur. 

On peut egalement mettre en contact I'echantillon biologique avec un 
ligand specifique du polypeptide reference SEQ ID N°9 et au moins un ligand specifique 
d'au moins un autre polypeptide tel que defini precedemment, puis on detecte la 

15 formation de complexes entre lesdits polypeptides et lesdits ligands specifiques desdits 
polypeptides ; etant entendu que par ligand on entend une molecule qui repond aux 
conditions decrites precedemment. 

Un autre objet de T invention est un fragment nucleotidique codant pour 
tout ou partie du polypeptide SEQ ID N° 9, et son utilisation pour obtenir une 

20 composition diagnostique, pronostique, prophylactique ou therapeutique destinee a 
detecter, pronostiquer, prevenir ou trailer un etat pathologique associe a une maladie 
degenerative et/ou auto-immune, eventuellement en association avec au moins un 
fragment nucleotidique tel que defini precedemment, et les fragments compl^mentaires 
desdits fragments. 

25 Par fragment polypeptidique, on entend au moins tout ou partie de la 

sequence peptidique d'une proteine, en particulier un fragment polypeptique qui 
comprend environ entre 5 et 15 acides amines et plus precisement environ entre 5 et 10 
acides amines et 6 et 15 acides amines. Et par fragment nucleotidique, on entend au 
moins tout ou partie d'une sequence nucleotidique, etant entendu que par sequence 

30 nucleotidique, sont couvertes les sequences ADN et ARN. 
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En particulier, par fragment polypeptidique ou nucleotidique, on entend 
soit des fragments associes a une meme unite moleculaire, soit des fragments dans un 
complexe moleculaire comprenant plusieurs sous-unites homologues ou heterologues 
obtenues de maniere naturelle ou artificielle, notamment par multi-epissage differentiel 
5 ou par synthase selective. 

L'invention concerne aussi un precede pour detecter au moins un 
polypeptide tel que defini precedemment, selon lequel on preleve un echantillon d'un 
fluide biologique d'un patient presentant un etat pathologique associe a une maladie 
degenerative et/ou neurologique et/ou auto-immune et eventuellement apres purification 
10 dudit echantillon de fluide biologique, on analyse par spectrometrie de masse le profil de 
masse obtenu a partir du fluide biologique et on compare a un profil de masse de 
reference. 

La presente invention concerne egalement 1' utilisation d^ou moins un 

15 polypeptide de I'invention pour defmir des agents efficaces therapeutiquement, et 
Tutilisation de ces agents pour prevenir et/ou trailer une maladie auto-immune et/ou 
neurologique et/ou degenerative, en particulier la sclerose en plaques. 

Ainsi, d'autres objets de I'invention sent les suivants : 

- Utilisation d'au moins un polypeptide comprenant au moins un fragment 

20 d*une proteine pour tester reflficacite d'un agent therapeutique, ladite proteine etant 
choisie paimi les proteines dont la sequence peptidique a I'etat nat if correspond a SEQ 
ID N** 1, SEQ ID N*^ 2, SEQ ID N° 3, SEQ ID W 4, SEQ ID N^' 5, SEQ ID N° 6, SEQ 
ID N° 7, SEQ ID N° 8, SEQ ID N° 9, SEQ ID N° 10, SEQ ID N° 11, SEQ ID 12, 
SEQ ID N° 13, SEQ ID N° 14, SEQ ID N° 15, SEQ ID 16, SEQ ID N° 17, SEQ ID 

25 N*" 18, SEQ ID N° 19, SEQ ID N° 20, SEQ ID N° 21, SEQ ID N° 22, SEQ ID N° 23, 
SEQ ID N*^ 24, SEQ ID N° 25, SEQ ID 26, SEQ ID N° 27, SEQ ID N° 28 et SEQ 
ID N° 29, ies sequences peptidiques qui presentent au moins 70 % d'identite de 
preference au moins 80 % d'identite et avantageusement au moins 98 d'identite avec 
Tune quelconque des sequences peptidiques SEQ ID N° 1 a 29, et les sequences 

30 peptidiques ou les fragments desdites sequences appartenant a une meme famille de 
proteines choisie parmi le perlecan, le precurseur de la proteine plasmatique de liaison au 
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retinol, du precurseur de I'activateur du ganglioside GM2, de la calgranuline B et de la 
saposine B ; 

- Utilisation d'au moins un polypeptide comprenant au moins un fragment 
d'une proteine pour definir un materiel biologique pour la preparation d'une 

5 composition pharmaceutique destinee au traitement d'une maladie degenerative et/ou 
neurologique et/ou auto-immune, telle que la sclerose en plaques, ladite proteine etant 
choisie parmi les proteines dont la sequence peptidique a I'etat natif correspond a SEQ 
ID N*^ 1, SEQ ID N*^ 2, SEQ ID N° 3, SEQ ID N° 4, SEQ ID N° 5, SEQ ID N° 6, SEQ 
ID N° 7, SEQ ID N° 8, SEQ ID N*' 9, SEQ ID N** 10, SEQ ID N° 1 1, SEQ ID N° 12. 

10 SEQ ID N*' 13, SEQ ID N*' 14, SEQ ID N** 1 5, SEQ ID N° 16, SEQ ID N** 17, SEQ ID 
N° 18, SEQ ID N° 19. SEQ ID N** 20, SEQ ID N** 21. SEQ ID N** 22, SEQ ID N° 23, 
SEQ ID N° 24, SEQ ID N** 25, SEQ ID N*' 26, SEQ ID N° 27, SEQ ID N'^* 28 et SEQ 
ID N** 29, les sequences peptidiques qui presentent au moins 70 % dMdentite de 
preference au moins 80 % d'identite et avantageusement au moins 98 d'identite avec 

15 Tune quelconque des sequences peptidiques SEQ ID N'' 1 a 29, et les sequences 
peptidiques ou les fragments desdites sequences appartenant a une meme famille de 
proteines choisie parmi le perlacan, le precurseur de la proteine plasmatique de liaison au 
retinol, du precurseur de Tactivateur du ganglioside GM2, de la calgranuline et de la 
saposine ; 

20 Selon une variante avantageuse de Tune des utilisations precedentes, le 

polypeptide est choisi parmi SEQ ID N** 2, 4,8, 9, 17. 24 ; 

- Utilisation d'au moins un fragment nucleotidique, pour tester refficacite 
d'un agent therapeutique pour un etat pathologique associe a une maladie degenerative 
et/ou neurologique et/ou auto-immune, selon laquelle ledit fragment nucleotidique est 

25 choisi parmi les fragments qui codent pour au moins un fragment d'une proteine, ladite 
proteine etant choisie parmi les proteines dont la sequence peptidique a Tetat natif 
correspond a SEQ ID N° 1, SEQ ID N° 2, SEQ ID N° 3, SEQ ID N° 4, SEQ ID N° 5, 
SEQ ID N** 6, SEQ ID N° 7. SEQ ID N° 8, SEQ IDN° 9, SEQ ID N° 10. SEQ ID N° 
11, SEQ ID N° 12, SEQ ID N° 13. SEQ ID N° 14, SEQ ID N° 15. SEQ ID N** 16, 

30 SEQ ID 17. SEQ ED N° 18, SEQ ID N*' 19, SEQ ID N° 20, SEQ ID N'' 21, SEQ ID 
N° 22, SEQ ID N° 23, SEQ ID N° 24, SEQ ID N° 25, SEQ ID N** 26, SEQ ID N*» 27, 
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SEQ ID N** 28 et SEQ ID N** 29, les sequences peptidiques qui presentent au moins 70 
% d'identite, de preference au moins 80 % et avantageusement au moins 98 % d'identite 
avec Tune quelconque des sequences peptidiques SEQ ID N° 1 a 29, et les fragments 
compl6mentaires desdits fragments et les fragments qui codent pour les sequences 
peptidiques ou les fragments desdites sequences appartenant a une meme famille de 
proteines choisie parmi le perlecan, le precurseur de la proteine plasmatique de liaison au 
retinol, du precurseur de I'activateur du ganglioside GM2, de la calgranuline B et de la 
saposine B. 

- Utilisation pour tester refficacite d*un agent therapeutique pour un etat 
pathologique associe a une maladie degenerative et/ou neurologique et/ou auto-immune, 
de proteines recombinantes et/ou codees par tout ou partie des fragments nucleotidiques 
definis au paragraphe precedent ; 

- Utilisation d'au moins un fragment nucleotidique 

pour la preparation d'une composition pharmaceutique destinee au traitement 
d'une maladie degenerative et/ou neurologique et/ou auto-immune, telle que la sclerose 
en plaques, selon laquelle ledit fragment nucleotidique est choisi parmi des fragments qui 
codent pour au moins un fragment d'une proteine, ladite proteine etant choisie parmi les 
proteines dont la sequence peptidique a Tetat natif correspond a SEQ ID N** 1, SEQ ID 
N** 2, SEQ ID 3, SEQ ID 4. SEQ ID N** 5, SEQ ID N° 6, SEQ ID N*> 7, SEQ ID 
N° 8, SEQ IDN° 9, SEQ ID N° 10, SEQ ID N° 1 1, SEQ ID N° 12, SEQ ID N° 13, 
SEQ ID NM4, SEQ ID 15, SEQ ID NM6, SEQ ID N° 17, SEQ ID N'' 18, SEQ ID 
19, SEQ ID N*' 20, SEQ ID N« 21, SEQ ID N° 22, SEQ ID N** 23, SEQ ID N° 24, 
SEQ ID N*^ 25. SEQ ID N° 26, SEQ ID N° 27, SEQ ID N° 28 et SEQ ID N° 29, les 
sequences peptidiques qui presentent au moins 70 % d'identite, de preference au moins 
80 % et avantageusement au moins 98 % dMdentite avec Tune quelconque des 
sequences peptidiques SEQ ID 1 a 29, et les fragments complementaires desdits 
fragments et les fragments qui codent pour les sequences peptidiques ou les fragments 
desdites sequences appartenant a une meme famille de proteines choisie parmi le 
perlecan, le precurseur de la proteine plasmatique de liaison au retinol, du precurseur de 
i'activateur du ganglioside GM2, de la calgranuline B et de la saposine B ; 



- Utilisation pour la preparation d'une composition pharmaceutique 
destinee au traitement d'une maladie degenerative et/ou neuroiogique et/ou auto- 
immune, telle que la sclerose en plaques, de proteines recombinantes et/ou codees par 
tout ou partie des fragments nucleotidiques defmis au paragraphe precedent ; 

5 Avantageusement, ledit fragment nucleotidique utilise code pour ladite 

proteine ; 

De preference, la sequence peptidique de Jadite proteine a Tetat natif 
consiste en une sequence choisie parmi Tune quelconque des SEQ ID N° 1 a 29, les 
sequences peptidiques qui present ent au moins 70 % d'identite de preference au moins 

10 80 % d'identite et avantageusement au moins 98 d'identite avec Tune quelconque des 
sequences peptidiques SEQ ID N° 1 a 29, et !es sequences peptidiques ou les fragments 
desdites sequences appartenant a une meme famille de proteines choisies parmi le 
perlecan, le precurseur de la proteine plasmatique de liaison au retinol, du precurseur de 
Tactivateur du ganglioside GM2, de la calgranuline B et de la saposine B. Les 

15 polypeptides sont preferentieUement choisis parmi SEQ ID N° 2, 4. 8, 9, 17, 24. 

- Utilisation d'au moins un fragment nucleotidique, pour tester TefFicacite 
d*un agent therapeutique pour un etat pathologique assocte a une maladie degenerative 
et/ou neuroiogique et/ou auto-immune selon laquelle ledit fragment est un fragment 
d'une sequence nucleique choisie parmi Tune quelconque des SEQ ID N** 30, SEQ ID 

20 3 1, SEQ ID N° 32, SEQ ID N° 33, SEQ ID 34, SEQ ID N** 35, SEQ ID N° 36, 
SEQ ID N° 37, SEQ ID N° 38, SEQ ID N° 39, SEQ ID 40, SEQ ID N** 41, SEQ ID 
N° 42, SEQ ID N° 43, SEQ ID N° 44, SEQ ID N° 45, SEQ ID N° 46 et SEQ ID N° 47, 
SEQ ID N° 48, SEQ ID N° 49 et SEQ ID N° 50, SEQ ID N° 51, SEQ ID N° 52, SEQ 
ID N° 53, SEQ ID 54, SEQ ID N° 55, SEQ ID N° 56, SEQ ID N° 57, SEQ ID 

25 66, SEQ ID N° 67, SEQ ID N° 68, SEQ ID N° 69, SEQ ID N°70 , SEQ ID N° 71, et 
leurs sequences complementaires. 

- Utilisation d'au moins un fragment nucleotidique 

pour la preparation d'une composition pharmaceutique destinee au traitement 
d'une maladie degenerative et/ou neuroiogique et/ou auto-immune, telle que la sclerose 
30 en plaques selon laquelle ledit fragment est un fragment d'une sequence nucleique 
choisie parmi Tune quelconque des SEQ ID N° 30, SEQ ID N° 3 1, SEQ ID N° 32, SEQ 
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ID N° 33, SEQ ID N** 34, SEQ ID N° 35, SEQ ID N« 36, SEQ ID N° 37, SEQ ID N° 
38, SEQ ID N° 39, SEQ ID N° 40, SEQ ID NMl, SEQ ID N° 42, SEQ ID 43. 
SEQ ID N° 44, SEQ ID N° 45, SEQ ID N« 46 et SEQ ID N'' 47, SEQ ID N<> 48, SEQ 
ID N** 49 et SEQ ID N** 50, SEQ ID N** 5 1, SEQ ID N° 52, SEQ ID N° 53, SEQ ID N° 
5 54, SEQ ID N° 55, SEQ ID N° 56, SEQ ID 57, SEQ ID N° 66, SEQ ID N°67, SEQ 
ID N° 68, SEQ ID N° 69, SEQ ID N°70 , SEQ ID 71. et leurs sequences 
complementaires. 

La sequence nucleique est de preference choisie parmi SEQ ID N** 30, 31, 

42, 53. 

10 -Utilisation de la lycorine pour la preparation d*une composition pour !a 

prevention et/ou le traitement de maladie degenerative et/ou neurologique et/ou auto- 
immune. 



Par efficacite therapeutique, on entend le benefice clinique et biologique 

15 acquis apres administration d'un agent therapeutique en vue d'une amelioration, voire 
d'une guerison de la maladie. Ce benefice se traduit entre autre par une diminution des 
signes cliniques, biologiques, et des effets pathologiques de la maladie apres une analyse 
clinique par le medecin et/ou des analyses biologiques, telles que imagerie par resonance 
magnetique, analyse des bandes oligoclonales dans le liquide cephalorachidien, analyse 

20 de potentiels 6voques et le test de detection de gliotoxicite appele bio-essai, dont ie 
principe est decrit dans la demande de brevet WO 98/1 1439 precedemment citee. Cette 
diminution des signes cliniques et effets pathologiques doit entramer un benefice pour le 
patient (Schwartz et Lazar, 1995, Elements de statistique medicale et biologique, eds 
Flammarion ; Lazar et Schwartz, 1995, Elements de statistique medicale et biologique, 

25 eds Flammarion ). La maladie etudiee de preference est la sclerose en plaques. 

On entend par composition a usage prophylactique et/ou therapeutique, 
toute composition qui comprend un agent therapeutiquement efficace. Ces agents 
therapeutiques sont capables (i) d'influencer de maniere qualitative et/ou quantitative 
Tactivite biologique et/ou la fonction des proteines d'interet identifiees dans la presente 

30 invention, de preference Pactivite gliotoxique et/ou (ii) de modular et/ou d'inhiber 
r expression de ces proteines et/ou (iii) de diminuer la concentration de ces proteines 
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dans un compartiment extracellulaire et/ou intracellulaire, et/ou de substituer une forme 
non pathogene a une forme pathogene, par exemple mutee, d*une de ces proteines et/ou 
de moduler leur fixation a au moins un de leur ligand ; ledit ligand etant une molecule 
qui repond aux criteres precedemment decrits. Differents agents therapeutiques sont 
5 produits en suivant les approches classiques largement decrites dans ia litterature. Les 
dififerents groupes d'agents therapeutiques definis a partir des proteines d'interet 
identifiees dans cette presente invention sont decrits ci-dessous. Leur activite ou 
efficacite prophylactique et/ou therapeutique est evaluee in vitro et/ou //7 vivo. 

Evaluation de I'efficacite d'un agent therapeutique in vitro : des 

10 echantillons d'urine d'individus sains et de patients atteints de la sclerose en plaque, de 
preference en phase active, sont testes pour leur aciiviie glioioxique /// vino en suivant 
le protocole du bio-essai decrit dans la demande de brevet WO 98/11439, 
precedemment citee. L'experience est realisee en parallele en ajoutant ou non dans les 
echantillons d'urine testes Tagent therapeutique dont refficacite est a tester. Des essais 

IS sont realises a differentes concentrations de cet agent, et apres differents temps 
d'incubation avec rechantillon, a une temperature d*environ 37**C ou a temperature 
ambiante, pour chaque concentration d'agent teste, avant la realisation du test bio-essai. 
L'activite gliotoxique est determinee pour chaque echantillon brut ou purifie d'urine 
temoin et de patient en presence ou en absence de T agent therapeutique teste. Un agent 

20 prophylactique et/ou therapeutique pour la sclerose en plaques est un agent qui permet 
une diminution ou une inhibition de Tactivite gliotoxique dans un fluide biologique des 
patients, en particulier dans Purine. Cette diminution ou inhibition est evaluee par 
rapport a Tactivite gliotoxique detectee dans le fluide biologique des patients SEP en 
absence de Tagent teste qui fixe la borne superieure et par rapport a Tactivite 

25 gliotoxique detectee dans Purine d'individu sain qui determine la borne inferieure 
(Schwartz et Lazar, 1995, Elements de statistique medicale et biologique, eds 
Flammarion ; Lazar et Schwartz, 1 995, Elements de statistique medicale et biologique, 
eds Flammarion). L'efficacite therapeutique de plusieurs agents peuvent etre evaluee en 
combinaison dans un meme essai. 

30 Evaluation de Tefficacite d'un agent therapeutique utilisant un modele 

animal : a un animal sont injectees des fractions d'urine purifiee et/ou au moins un 
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polypeptide de Tinvention et/ou au moins une proteine obtenue par recombinaison 
genetique qui correspond a au moins un polypeptide de Tinvention et/ou au moins un 
polypeptide de synthese dont la sequence en acides amines correspond a la sequence 
d'au moins un polypeptide de I'invention. Les injections sont effectuees, a difFerentes 
5 concentrations etablies, a des animaux mammiferes, tels que souris ou rat, de preference 
un rat Lewis selon le protocole decrit dans la demande de brevet W097/33466 citee 
precedemment. A des series d 'animaux sont injectees, par voie intradermique. 
intraveineuse, intrathecale. intracerebrale, intramusculaire, ou autres. difFerentes 
concentrations d'une fraction d'urine brute ou purifiee ou d'au moins un polypeptide 

10 et/ou une proteine, tels que defmis ci-dessus. Un controle negatif est efFectue en 
parallele. L'agent prophylactique et/ou therapeutique a evaluer et ensuite injecte a 
difFerentes concentrations et par difFerentes voies d*administration a un animal 
mammifere, de preference a une souris ou a un rat. Les injections sont realisees en une 
seule dose ou en doses repetees, avec difFerents temps d'intervalle entre chaque 

15 administration. Quelques heures a quelques semaines apres T administration, des 
echantillons biologiques, de preference du sang, du serum, du liquide cephalo-rachidien, 
de Turine sont preleves. Sur ces echantillons sont realises : 

(i) une mesure de I'activite gliotoxique par le bio-essai, et/ou 

(ii) une mesure d'activite des polypeptides et/ou proteines d'interet de Tinvention, seuls 
20 ou en combinaison comme decrit au moins dans : Li et al., 1983, Am J Hum Genet 

35 :629-634 ; Li et al., 1988 J Biol Chem 263 : 6588-6591 ; Li et al., 1981 J Biol Chem 
256 : 6234-6240 ;Li et al., 1976 J Biol Chem 251 :1159 ; Kase et al., 1996, FebsLetters 
393 : 74-76 ; Kishimoto et al., 1992, J Lipid Res 33 : 1255-1267 ; O'Brien et al., 1991 
Faseb J 5 : 301-308 ; Murthy et al.,1993 J Immunol 151 : 6291-6301 ; Murao et al., 
25 1990 Cell growth Differ 1 : 447-454, et/ou 

(iii) un dosage des polypeptides et/ou proteines d'interet, seuls ou en combinaison, par 
ELISA (Enzyme Linked-Immunosorbant Assay) et/ou Western Blot, en utilisant des 
anticorps ou des fragments d'anticorps capables de se fixer a au moins un des 
polypeptides et/ou proteines de Tinvention. ou leur fragment, et/ou 
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iv) un dosage d'anticorps specifiques des polypeptides et/ou proteines d'interet ou leurs 
fragments, seuls ou en combinaison ou le dosage d'au moins un ligand capable de se 
fixer aux polypeptides et/ou proteines d'interet ou leurs fragments, et/ou 
(v) un dosage de la reponse immune cellulaire « helper » et/ou cytotoxique induite 
5 centre les polypeptides et proteines d'interet ou leurs fragments et tout peptide 
immunogene derivant de ces polypeptides, proteines et fragments, en realisant, par 
exempie, un test d'activation in vitro de cellules lymphocytes T « helper » specifiques de 
I'antigene administre ; en quantifiant les lymphocytes T cytotoxiques selon la technique 
dite ELISPOT decrite par Scheibenbogen et al.,1997 Clinical Cancer Research 3 : 221- 

10 226. Une telle determination est particulierement avantageuse lorsque Ton veut evaluer 
refficacite d'une approche vaccinale pour la mise en ceuvre chez un patient donne ou 
pour diagnostiquer et/ou pronostiquer un etat pathologique potentiel en cherchant a 
mettre en evidence une reponse immune naturellement developpee par le patient contre 
I'antigene, les polypeptides, les proteines d'interet ou les fragments immunogenes 

IS derives de ces proteines. 

Par ' Ligand capable de se fixer a une proteine\ on entend designer toute 
molecule capable de reconnaitre la proteine ou une partie de la proteine. Cela peut etre 
verifie par exempie in vitro par tests Elisa et/ou Western blot ( ). 

On designe par 'polypeptides et/ou proteines d'interet de Tinvention' le fragment 

20 C-terminal du perlecan (SEQ ID N°2), le precurseur de la proteine plasmatique de 
liaison au retinol (SEQ ID N°4), la proteine activateur du GM2 (SEQ ID N° 8), la 
proteine mutee de I'activateur du GM2 (SEQ ID N° 9), la calgranuline B (SEQ ID N° 
17). la saposine B (SEQ ID N° 24), les proteines ou fragments appartenant a la famille 
du precurseur de la proteine plasmatique de liaison au retinol (par exempie SEQ ID N° 5 

25 a 7), les proteines ou fragments appartenant a la famille de la proteine activateur du 
GM2 (par exempie SEQ ID N° 10 a 16), les proteines ou fragments appartenant a la 
famille de la proteine calgranuline B (par exempie SEQ ID N° 18 a 23), les proteines ou 
fragments appartenant a la famille de la proteine saposine B (par exempie SEQ ID N*' 25 
a 29) et les sequences peptidiques qui presentent au moins 70 % d'identite de preference 

30 au moins 80 % d'identite et avantageusement au moins 98 d'identite avec Tune 
quelconque des sequences peptidiques SEQ ID N° I a 29. 
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L'animal est ensuite sacrifie et des coupes histologiques de differents tissus 
sont realisees, de preference des coupes de cerveaux. Differentes etudes et observations 
sont realisees pour detecter et/ou quantifier les effets caracteristiques des polypeptides 
et/ou proteines actives associees a la fraction gliotoxique , c'est a dire une apoptose des 
cellules gliales, et/ou Touverture de la barriere hemato-encephalique, et/ou une 
demyelinisation. La presence ou Texpression des polypeptides et/ou proteines d'interet 
identifiees est egalement observee et/ou quantifiee dans ces tissus : 

(i) par des analyses d'immunohistologie classiques en utilisant des ligands des 
polypeptides et/ou proteines d'interet et/ou leurs fragments et/ou des anticorps 
monoclonaux ou polyclonaux ou des fragments desdits qui se lient aux polypeptides 
et/ou proteines d'interet, ou a leurs fragments, et/ou 

(ii) par des techniques d'hybridation /// 5/7// classiques en utilisant des fragments d'acides 
nucleiques ou des oligonucleotides definis a partir des sequences polypeptidiques et/ou 
proteiques d'interet ; et/ou 

(iii) par des techniques d 'amplification par PGR et/ou RT-PCR in situ en utilisant des 
fragments d'acides nucleiques ou des amorces defmis a partir des sequences 
polyeptidiques et/ou proteiques d'interet. 

Par anticorps capable de se fixer a un polypeptide, a une proteine ou a leurs 
fragments, on entend tout anticorps monoclonal ou polyclonal et tout fragment desdits 
anticorps capable de reconnaitre le polypeptide, la proteine ou leurs fragments. La 
capacite des anticorps a reconnaTtre lesdits polypeptides, proteines ou leurs fragments 
est verifiee in vitro, par exemple en ELISA et/ou Western Blot. Un anticorps capable 
de se fixer a la proteine saposine B (SEQ ID N° 24) ou a tout fragment de cette proteine 
est decrit par Misasi et al. 1998, J. NeuroChem. 71 : 2313 et Klein et al. 1994, BBRC 
200 : 1440-1448 ou peut etre produit en utilisant les methodes conventionnelles, par 
exemple celles referencees precedemment pour la production d'anticorps monoclonaux 
et polyclonaux, par immunisation a partir de la proteine naturelle, d'une proteine 
recombinante, d*un polypeptide de synthese ou de leurs fragments. Les peptides 
immunogenes pour la production d'anticorps monoclonaux anti-saposine B sont les 
peptides correspondant aux sequences SEQ ID N° 61 et SEQ ID N° 62. 
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Par exemple, un anti corps capable de se fixer a la proteine activatrice du 
GM2 (SEQ ID N° 8) ou a tout fragment de cette proteine est illustre par Yuziuk et ai., 
1998 J Biol Chem 273 : 66-72 ou peut etre produit en utilisant les methodes 
conventionnelles connues de Thomme de Tart. Cet anticorps peut etre par exemple 
5 produit apres injection a des souris ou lapin de la proteine naturelle ou tout fragment, 
et/ou de la proteine recombinante ou tout fragment, et/ou de peptides defmis et 
synthetises a partir de la sequence proteique de la proteine. Les peptides immunogenes 
utilises pour la production d'anticorps monoclonaux anti-GM2 sont les peptides 
references SEQ ID N° S8, SEQ ID N° 59 et SEQ ID N° 60. Un anticorps capable de se 

10 fixer a la proteine Galgranuline B (SEQ ID N° 1 7) ou a tout fragment de cette proteine 
est dccrit par Sainilgny ei at., 1992 J Invest Dermatol 99 : 639-644 et Goebeier et al 
1994 J Leukoc Biol 55 : 259-261, ou peut etre produit en utilisant les methodes 
conventionnelles. Les peptides immunogenes pour la production d'anticorps 
monoclonaux anti-calgranuline B sont les peptides correspondant aux sequences SEQ 

15 ID N** 63. SEQ ID W 64 et SEQ ID N** 65. Un anticorps capable de se fixer a la 
proteine mutee activatrice du GM2 (SEQ ID N°9) ou a tout fragment de cette proteine 
peut etre produit en utilisant les methodes conventionnelles definies ci dessus. 

Par proteine naturelle et fragment, on entend toute proteine isolee, purifiee 
totalement ou partiellement obtenue a partir d'echantillon humain ou animal et tout 

20 fragment obtenu a partir de cette proteine. Par exemple, on obtient la proteine naturelle 
correspondant a la saposine B (SEQ ID N° 24) en suivant la technique decrite par 
Waring et al. 1998 Mol Genet Metab 63 : 14-25 ; la proteine naturelle correspondant a 
la proteine activatrice du GM2 (SEQ ID N° 8) en suivant la technique decrite par 
DeGasperi et al-,1989 Biochem J 260 : 777-783, Vogel et al.. 1987 Arch Biochem 

25 Biophys 259: 627-638. Mitsuyama, 1983 Hokkaido Igaku Zasshi 58: 502-512; 
Hirabayashi et al 1983 J Neurochem 40: 168-175, Conzelmann et al, 1979 Hoppe 
Seylers Z Physiol Chem 360 : 1837-1849, Li et al.. 1976 J Biol Chem 251 : 1159-1 163. 
La proteine naturelle correspondant a la calgranuline B (SEQ ID N° 17) est obtenue en 
suivant la technique decrite par Hitomi et al. 1996 J Cell Sci 109 : 805-815, Van den 

30 Bos et al. 1998 Protein Expr Purif 13 : 313-318 et Raftery et al. 1996 Biochem J 316 : 
285-293. 
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Par proteine recombinante ou fragment d'une proteine recombinante, on 
fait reference a toute proteine ou fragment de proteine produit dans une cellule 
procaryote ou eucaryote a partir d'une sequence nucleotidique codant pour la proteine 
ou son fragment et transfectee dans la cellule, cette proteine ou son fragment etant 
5 ensuite purifiee. D'une maniere generale, toute cellule issue d'un organisme procaryote 
ou eucaryote peut etre utilisee dans le cadre de la presente invention, mais les cellules 
issues d'organismes eucaryotes sont preferees. On peut citer a litre d*exemple les 
cellules CHO, les cellules COS, les cellules Semliki. Aux fins de la presente invention, 
ladite cellule peut etre sauvage ou mutante. Par exemple, la proteine recombinante 

10 correspondant a la saposine B (SEQ ID N° 24) peut etre obtenue en suivant les 
techniques decrites par Zaltash et al.l998 Bebbs letter 423 : 1-4 et Qi et al. 1994 J Biol 
Chem 269: 16746-16753. Une telle proteine recombinante est au moins disponible 
aupres de Kase etg al. 1996 Febs Lett 393 : 74>76. La proteine recombinante 
correspondant a la proteine activatrice du GM2 (SEQ ID N° 8) peut etre produite par 

15 les techniques decrites par Yuziuk et al. 1998 J Biol Chem 273 : 66-72 et Bierfreund et 
al., 1999 Neurochem Res 24 : 295-300. La proteine recombinante correspondant a la 
calgranuline B (SEQ ID N** 17) peut etre obtenue selon le protocole de Longbottom et 
al.l992 Biochim Biophys Acta 1120 :215-222, Raftery et al. 1999 Protein Expr Purif 
15 :228-235. Une telle proteine recombinante est dispponible au moins aupres de 

20 Klempt et al. 1997 Febs Letter 408 : 81-84. 

Par sequence nucleotidique d'ADN ou fragment nucleotidique d'ADN 
codant pour tout ou partie de la proteine saposine B (SEQ ID N''24), on entend la 
sequence d'acides nucleiques SEQ ID N° 53 ou un fragment de cette sequence. Par 
sequence ou fragment nucleotidique ARK codant pour tout ou partie de la proteine 

25 saposine B (SEQ ID N° 24), on entend toute sequence deduite de la sequence d'ADN 
SEQ ID 53, en tenant compte du code genetique et des phenomenes d'epissage. 

Par sequence nucleotidique d*ADN ou fragment nucleotidique d'ADN 
codant pour tout ou partie de la proteine activatrice du GM2 (SEQ ID N° 8), on entend 
la sequence d'acides nucleiques SEQ ID N° 31 ou un fragment de cette sequence. Par 

30 sequence ou fragment nucleotidique d*ARN codant pour tout ou partie de la proteine 
activatrice du GM2 (SEQ ID N° 8). on entend toute sequence deduite de la sequence 
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ADN SEQ ID N° 31, en tenant compte du code genetique et des phenomenes 
d'epissage. 

Par sequence nucleotidique d'ADN ou fragment nucleotidique d'ADN 
codant pour tout ou partie de la proteine calgranuline B (SEQ ID N° 17), on entend la 
5 sequence d'acides nucleiques SEQ ID N° 42 ou un fragment de cette sequence. Par 
sequence ou fragment nucleotidique d'ARN codant pour tout ou partie de la proteine 
calgranuline B (SEQ ID N° 17), on entend toute sequence deduite de la sequence ADN 
SEQ ID N° 42, en tenant compte du code genetique et de phenomenes d'epissage. 

Par sequence ou fragment nucleotidique codant pour tout ou partie de la 
10 proteine mutee (SEQ ID N° 9), on entend la sequence d'acides nucleiques deduite de la 
sennence SEO TD N° 9 en tenant cnmnte du code genetinue Par senuence on frapment 
nucleotidique ARN codant pour tout ou partie de cette proteine mutee B (SEQ ID N° 
9), on entend toute sequence deduite de la sequence ADN, en tenant compte du code 
genetique et de phenomenes d'epissage. 
15 Par activite proteique, on entend une fonction caracteristique biologique de 

la proteine. 

Cette activite proteique peut etre mise en evidence par des techniques 
connues de Thomme de Part. Par exemple, I'activite de la saposine B (SEQ ID N° 24) et 
des proteines de la famille de la saposine B (par exemple SEQ ID N° 25 a 29), peut etre 

20 detectee par la mise en oeuvre des protocoles decrits par Li et al., 1983, Am J Hum 
Genet 35 :629-634,; Li et al., 1988 J Bio! Chem 263 : 6588-6591, Li et al., 1981 J Biol 
Chem 256 : 6234-6240 et Li et al., 1976 J Biol Chem 251 :1159. Par activite de la 
proteine activatrice du GM2 (SEQ ID N** 8) et des proteines de la meme famille (par 
exemple SEQ ID N° 10 a 16), on entend au moins T activite detectee par la mise en 

25 oeuvre des protocoles deciits par exemple par Kase et a!., 1 996, Febs Letters 393 : 74- 
76, Kishimoto et al., 1992, J Lipid Res 33 : 1255-1267 et O'Brien et al., 1991 Faseb J 
5 : 301-308. Par activite de la calgranuline B (SEQ ID N** 17) et les proteines de la 
meme famille de la calgranuline b (par exemple SEQ ID N° 18a 23) et toute, on entend 
au moins Tactivite detectee par la mise en oeuvre des protocoles decrits par exemple par 

30 Murthy et al.,1993 J Immunol 151 : 6291-6301 et Murao et al.. 1990 Cell growth Differ 
1 : 447-454. 
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L'obtention d'un modele animal transgenique, de preference murin, pour 
une pathologic humaine est techniquement realisable. Brievement, Panimal transgenique 
est produit en utilisant les techniques conventionnelles decrites et possede integre dans 
son genome les acides nucleiques codant pour les proteines ou leurs fragments. 
5 Evaluation de refficacite d'un agent therapeutique et suivi therapeutique ex 

vivo, chez Thomme : les agents therapeutiques a tester pour une activite therapeutique 
et/ou pour un suivi therapeutique sont administres par differentes voies a Thomme, telles 
que les voies intradermique, intraveineuse, intramusculaire, intracerebrale, orale, ou 
autres. Differentes doses sont administrees a Tetre humain. Le dossier clinique du 

10 patient au moment de la premiere administration est parfaitement connu. Une ou 
plusieurs administrations peuvent etre realisees avec des temps d'intervalle differents 
entre chaque administration pouvant aller de quelques jours a quelques annees. Des 
echantillons biologiques sont preleves a des intervalles de temps determines apres 
administration de I 'agent therapeutique. de preference du sang, du serum, du liquide 

15 cephalorachidien et de Turine. Differentes analyses sont realisees a partir de ces 
echantillons. Juste avant la premiere administration de T agent therapeutique, ces 
prelevements et ces memes analyses sont egalement realises. Un examen cHnique et 
biologique classique (IRM, bandes oligoclonales dans le liquide cephalorachidien, 
potentiels evoques) est realise egalement en parallele des analyses supplementaires qui 

20 sont etre decrites ci dessous, a differentes temps de Tanalyse. Les analyses realisees 
sont : 

(i) une mesure de Tactivite gliotoxique par le bio-essai a partir d' echantillons de 

serum, de LCR et d 'urine, 

et/ou 

25 (ii) une mesure d 'activite des proteines d'interet identifiees dans la presente 
invention seules ou en combinaison comme decrit par exempie par : Li et al., 1983, Am 
J Hum Genet 35 :629-634 ; Li et aK. 1988 J Biol Chem 263 : 6588-6591 ; Li et al., 1981 
J Biol Chem 256 : 6234-6240 ;Li et al., 1976 J Biol Chem 251 :1159 ; Kase et al., 1996, 
FebsLetters 393 : 74-76 ; Kishimoto et al., 1992, J Lipid Res 33 : 1255-1267 ; O'Brien 

30 et al., 1991 Faseb J 5 : 301-308 ; Murthy et al.,1993 J Immunol 151 : 6291-6301 ; 
Murao et al.. 1990 Cell growth Differ 1 : 447-454, 
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et/ou 

(iii) un dosage des proteines d'interet ou de leurs fragments, seuls ou en 
combinaison, dans les echantillons de sang/semm, LCR, urine par ELISA et/ou Western 
Blot, en utilisant des anticorps ou des fragments d'anticorps capables de se fixer a au 
moins une des proteines ou a un de leur fragment. 

(iv) un dosage d'anticorps specifiques des proteines d'interet ou de leurs fragments dans 
des echantillons de sang/serum, LCR. urine, par ELISA et/ou Western Blot en utilisant 
une proteine naturelle ou un fragment de la proteine naturelle et/ou une proteine 
recombinante ou un fragment de cette proteine recombinante, seuls ou en combinaison. 
De meme un dosage de ligands capables de se fixer aux proteines d*interet identifiees, 
seules ou en combinaison, peut etre realise. 

(v) un dosage de la reponse immune cellulaire « helper » et/ou cytotoxique induite 
contre les proteines d'interet et tout peptide immunogene derivant de ces proteines, par 
exemple en realisant un test deactivation in vitro de cellules lymphocytes T specifiques 
de Tantigene administre (exemple). Par exemple en realisant un test d'activation in vitro 
de cellules lymphocytes T helper specifiques de Tantigene administre (exemple) ; Par 
exemple en quantifiant les lymphocytes T cytotoxiques selon la technique dite ELISPOT 
decrite par Scheibenbogen et al.,1997 Clinicla Cancer Research 3 : 221-226. Une telle 
determination est particulierement avantageuse lorsque Ton souhaite evaluer Tefficacite 
d'une approche vaccinale mise en oeuvre chez un patient donne ou pour diagnostiquer 
un etat pathologique potentiel chez un patient en cherchant a mettre en evidence une 
reponse immune naturellement developpee par ledit patient contre I'antigene les 
proteines d'interet ou tout fragment immunogene derives de ces proteines, seuls ou en 
combinaison, 

et/ou 

(vi) une detection de fragments d'ADN et/ou d'ARN codant pour les proteines ou un 
fi'agment des proteines d'interet par hybridation nucleotidique selon les techniques bien 
connues de Phomme de Tart (Southern blot. Northern blot, ELOSA « Enzyme-Linked 
Oligosorbent Assay » (Katz IB et al., Am. J. Vet. Res., 1993 Dec ; 54 (12) :2021-6 et 
Francois Mallet et al.. Journal of Clinical Microbiology, June 1993, pi 444- 1449)) et/ou 
par methode d' amplification de TADN et/ou TARN . par exemple par PCR, RT-PCR, 
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en utilisant des fragments d'acides nucleiques codant pour la sequence des proteines 

d'interet, 

et/ou 

(vii) par biopsie de tissus, de preference du cerveau, et 1' observation des effets 
5 caracteristiques des proteines actives associees a la fraction gliotoxique, c'est a dire une 

apoptose des cellules gliales et/ou I'ouverture de la barriere hemato-encephalique et/ou 

Tobservation de phenomenes de demyelinisation, 

et/ou 

(viii) par biopsie de tissus ou sur cellules circulantes (sang, LCR), Tobservation de la 
10 presence des proteines d'interet et I'estimation de leur expression par observation 

immunohistologique sur des coupes histologiques realisees a partir des tissus, en 
utilisant des ligands et/ou des anticorps ou leurs fragments capables de se fixer aux 
proteines d'interet, 
et/ou 

15 (ix) par biopsie de tissus ou sur cellules circulantes (sang, LCR). Tobservation de 
I'expression des proteines d'interet par hybridation in situ des molecules d'ARN codant 
pour les proteines d'interet en utilisant des acides nucleiques defmis a partir des 
sequences des proteines d'interet, 
et/ou 

20 (x) par biopsie de tissus ou sur cellules circulantes (sang, LCR), la determination de 
Texpression des proteines d'interet par amplification de ces AR>J par des techniques 
classiques, comme par exemple, la RT-PCR, en utilisant des acides nucleiques defmis a 
partir des sequences des proteines d'interet. 

On designe par 'polypeptides et/ou proteines d'interet de 1' invention* le fragment 

25 C-terminal du perlecan (SEQ ID N°2), le precurseur de la proteine plasmatique de 
liaison au retinol (SEQ ID N°4), la proteine activateur du GM2 (SEQ ID N'^^ 8), la 
proteine mutee de I'activateur du GM2 (SEQ ID N** 9), la calgranuline B (SEQ ID N° 
17), la saposine B (SEQ ID N° 24), les proteines ou fragments appartenant a la famille 
du precurseur de la proteine plasmatique de liaison au retinol (par exemple SEQ ID N° 5 

30 a 7), les proteines ou fragments appartenant a la famille de la proteine activateur du 
GM2 (par exemple SEQ ID N° 10 a 16). les proteines ou fragments appartenant a la 
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famille de la proteine calgranuline B (par exemple SEQ ID N° 18 a 23), les proteines ou 
fragments appartenant a la famille de la proteine saposine B (par exemple SEQ ID N° 25 
a 29), et les sequences peptidiques qui presentent au moins 70 % d'identite de 
preference au moins 80 % d'identite et avantageusement au moins 98 d'identite avec 
Tune quelconque des sequences peptidiques SEQ ID N° 1 a 29. 

On designe par sequence d'acides nucleiques ADN ou fragments codant pour les 
'polypeptides et/ou proteines d'interet de rinvention' la sequence d'acides nucleiques 
codant pour le fragment C-terminal du perlecan (SEQ ID N°2), la sequence d'acides 
nucleiques codant pour le precurseur de la proteine plasmatique de liaison au retinol 
(SEQ ID N°4), la sequence d*acides nucleiques (SEQ ID N*" 31) codant pour la 
proteine activateur du GM2 (SFO TD N° 8), la sequence d'acides nucleiques codant 
pour la proteine mutee de I'activateur du GM2 (SEQ ID N° 9), la sequence d'acides 
nucleique (SEQ ID N° 42) codant pour la calgranuline B (SEQ ID N** 17), la sequence 
d'acides nucleiques (SEQ ID N**53) codant pour la saposine B (SEQ ID N° 24), les 
sequences d'acides nucleiques ADN et/ou ARN (SEQ ID N° 30 a 57) codant pour les 
proteines ou fragments appartenant a la famille du precurseur de la proteine plasmatique 
de liaison au retinol (par exemple SEQ ID N** 5 a 7), les proteines ou fragments 
appartenant a la famille de la proteine activateur du GM2 (par exemple SEQ ID N° 10 a 
16), les proteines ou fragments appartenant a la famille de la proteine calgranuline B 
(par exemple SEQ ID 18 a 23), les proteines ou fragments appartenant a la famille de 
la proteine saposine B (par exemple SEQ ID N° 25 a 29). 

Une proteine ou un variant d'une proteine choisie plus particulierement 
parmi les sequences defmies dans les identificateurs SEQ ID N°s 2, 4, 8 , 9, 17 et 24 ou 
leurs fragments, ou parmi les sequences correspondant aux proteines des families de ces 
dites sequences (par exemple SEQ ID N° 1, SEQ ID N° 3, SEQ ID N° 5 a 7, SEQ ID 
10 a 16, SEQ ID N** 18 a 24, SEQ ID N° 25 a 29). et les sequences peptidiques qui 
presentent au moins 70 % d'identite de preference au moins 80 % dMdentite et 
avantageusement au moins 98 d'identite avec Tune quelconque des sequences 
peptidiques SEQ ID N° 1 a 29, independamment ou en combinaison, presente un effet 
toxique directement ou indirectement, vis a vis de cellules, en particulier vis a vis des 
cellules gliales, qui est mis en evidence par le bio-essai precite. Les auto-anticorps 
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produits en reponse a la presence de cette proteine ou de ces proteines sont associes au 
processus auto-immun. Ainsi, la cible du ou des agent(s) therapeutique(s) est par 
exemple (i) la proteine naturelle ou les proteines naturelles ou leurs variants dans le but 
de reguler leur expression et/ou leur concentration intracellulaire et/ou leur 

5 concentration dans la circulation, (ii) un anticorps specifique d'au moins une telle 
proteine. L'agent therapeutique ou les agents therapeutiques definis eliminent la cible 
directement, par induction d*une reponse immune specifique et/ou la neutralisent. 

La presente invention concerne done un materiel biologique pour la 
preparation d'une composition pharmaceutique destinee au traitement de mammiferes 

10 atteints de pathologies degenerative et/ou autoimmune et/ou neurologique, de 
preference la sclerose en plaques, ladite composition comprenant : 

(i) soit au moins une proteine naturelle et/ou une proteine recombinante ou 
leurs fragments dont la sequence correspond a tout ou partie des sequences referencees 
SEQ ID N° 2, 4. 8, 9, 17 et 24 et les sequences peptidiques ou les fragments desdites 

15 sequences appartenant a une meme famille de proteines choisie parmi le perlecan, le 
precurseur de la proteine plasmatique de liaison au retinol, du precurseur de Tactivateur 
du ganglioside GM2, de la calgranuline B et de la saposine B (par exemple SEQ ID N**l, 
SEQ ID N° 3, SEQ ID N° 5 a 7, SEQ ID N** 10 a 16, SEQ m N** 18 a 23, SEQ ID N° 
25 a 29), et les sequences peptidiques qui presentent au moins 70 % d*identite de 

20 preference au moins 80 % d'identite et avantageusement au moins 98 dMdentite avec 
Tune quelconque des sequences peptidiques SEQ ID N"* la 29, independamment ou en 
combinaison, 

(ii) soit au moins un ligand specifique d'au moins une desdites proteines ou 
leurs fragments dont la sequence correspond a tout ou partie des sequences referencees 

25 SEQ ID N** 2, 4. 8, 9, 17 et 24, et les sequences peptidiques ou les fragments desdites 
sequences appartenant a une meme famille de proteines choisie parmi le perlecan, le 
precurseur de la proteine plasmatique de liaison au retinol, du precurseur de I'activateur 
du ganglioside GM2, de la calgranuline B et de la saposine B (par exemple SEQ ID N^'l. 
SEQ ID N° 3, SEQ ID N° 5 a 7, SEQ ID N*' 10 a 16, SEQ ID N° 18 a 23, SEQ ID N° 

30 25 a 29), et les sequences peptidiques qui presentent au moins 70 % d'identite de 
preference au moins 80 % d'identite et avantageusement au moins 98 d'identite avec 
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Tune quelconque des sequences peptidiques SEQ ID N° I a 29, independamment ou en 
combinaison, 

(iii) soit au moins un anticorps polyclonal ou monoclonal specifique d'au 
moins une desdites proteines ou leurs fragments dont la sequence correspond a tout ou 

5 partie des sequences referencees SEQ ID N° 2, 4, 8, 9, 17 et 24, et les sequences 
peptidiques ou les fragments desdites sequences appartenant a une meme famille de 
proteines choisies parmi le perlecan, le precurseur de la proteine plasmatique de liaison 
au retinol, du precurseur de Tactivateur du ganglioside GM2, de la calgranuline B et de 
la saposine B (par exemple SEQ ID N°l, SEQ ID N° 3, SEQ ID N° 5 a 7, SEQ ID N° 
10 10 a 16, SEQ ID N"* 18 a 23, SEQ ID N° 25 a 29), et les sequences peptidiques qui 
presentent au moins 70 % d'identite de preference au moins 80 % d'identite et 
avantageusement au moins 98 d*identite avec I'une quelconque des sequences 
peptidiques SEQ ID N° 1 a 29, independamment ou en combinaison, 

(iv) soit au moins une sequence d'acide nucleique comprenant au moins un 
15 gene d'interet therapeutique dont la sequence nucleique est deduite des sequences 

d'ADN et d'ARN codant pour tout ou partie des proteines dont les sequences sont 
referencees SEQ ID N** 2, 4, 8, 9, 17 et 24, et les sequences d'ADN et/ou ARN (par 
exemple SEQ ID N° 30 a 57) codant pour tout ou partie des proteines appartenant a une 
meme famille de proteines choisies parmi le perlecan, le precurseur de la proteine 
20 plasmatique de liaison au retinol, du precurseur de Tactivateur du GM2. de la 
calgranuline B et de la saposine B, en association avec des elements assurant 
Texpression dudit gene d'interet therapeutique in vivo dans des cellules cibles destinees 
a etre genetiquement modifiees par la sequence nucleique du gene d'interet 
therapeutique, 

25 (v) soit au moins une cellule de mammifere ne produisant pas naturellement 

la proteine d'interet ou les proteines d'interet ou tout fragment de cette ou de ces 
proteine(s) ou des anticorps specifiques d'au moins une desdites proteines ou de ses 
fragments ladite cellule mammifere etant genetiquement modifiee /// v/7ro par au moins 
une sequence d'acide nucleique ou un fragment d'une sequence d'acide nucleique ou 

30 une association de sequences d'acides nucleiques correspondant a des fragments 
d'acides nucleiques issus d'un meme gene ou de genes difFerents, la ou lesdites 
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sequences nucleiques etant deduite(s) des sequences d'ADN et ARN codant pour les 
proteines referencees SEQ ID N° 2, 4, 8, 9, 17 et 24, et les sequences d'ADN et/ou 
ARN (par exemple SEQ ID N° 30 a 57) codant pour tout ou partie des proteines 
appartenant a une meme famille de proteines choisies parmi le perlecan, le precurseur de 
5 la proteine plasmatique de liaison au retinol, du precurseur de I'activateur du GM2, de la 
calgranuline B et de la saposine B, ledit gene d'interet therapeutique codant pour tout 
ou partie de la proteine d*interet, d'un fragment de la proteine d'interet ou d*un 
anticorps specifique de la proteine d'inter§t qui sera exprime a la surface de ladite cellule 
de mammifere (Toes et al., 1997,PNAS 94: 14660-14665). La composition 

10 pharmaceutique peut contenir un agent therapeutique seul dirige contra une cible seule 
ou des agents pris en combinaison diriges contre plusieurs cibles. 

On designe par 'polypeptides et/ou proteines d'interet de Tinvention' le fragment 
C-terminal du perlecan (SEQ ID N°2X le precurseur de la proteine plasmatique de 
liaison au retinol (SEQ ID N°4), la proteine activateur du GM2 (SEQ ID N° 8), la 

15 proteine mutee de Tactivateur du GM2 (SEQ ID N** 9), la calgranuline B (SEQ ID 

17), la saposine B (SEQ ID N° 24), les proteines ou fragments appartenant a la famille 
du precurseur de la proteine plasmatique de liaison au retinol (par exemple SEQ ID N° 5 
a 7), les proteines ou fragments appartenant a la famille de la proteine activateur du 
GM2 (par exemple SEQ ID N° 10 a 16), les proteines ou fragments appartenant a la 

20 famille de la proteine calgranuline B (par exemple SEQ ID N° 18a 23), les proteines ou 
fragments appartenant a la famille de la proteine saposine B (par exemple SEQ ID N° 25 
a 29 et les sequences peptidiques qui presentent au moins 70 % d'identite de preference 
au moins 80 % d'identite et avantageusement au moins 98 d'identite avec Tune 
quelconque des sequences peptidiques SEQ ID N** 1 a 29. 

25 A partir des connaissances des sequences en acides amines des proteines 

d'interet identifiees dans la presente invention, il est a la portee de Thomme de Tart de 
definir et utiliser les molecules decrites ci dessus et/ou toute molecule capable de se fixer 
au dites molecules, et/ou toute molecule capable dMnhiber lesdites molecules. Ainsi la 
presente invention concerne Tutilisation de proteines naturelles et/ou recombinantes 

30 et/ou de polypeptides de synthese et leurs fragments, de ligand capables de se fixer au 
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dites proteines ou a leur(s) fragment{s), par exemple des anticorps ; de proteines 
inhibitrices de la fonction et/ou de P expression et/ou de la fixation desdites proteines 

Utilisation de proteine(s) et/ou peptide(s) naturel(s) et/ou de proteine(s) 
recombinante(s) et/ou de polypeptide(s) de synthese correspondant aux proteines 
5 d'interet identifiees dans !a presente invention. 

La presente invention concerne un materiel biologique pour la preparation 
de compositions pharmaceutiques destinees au traitement de mammiferes atteint de 
maladie auto-immune, de preference la sclerose en plaques, comprenant 

(i) soit au moins une proteine naturelle et/ou une proteine recombinante 

10 et/ou un polypeptide de synthese choisi parmi les proteines dont les sequences en acides 
amines sont referencees SEQ ID W 2, 4, 8, 9, 1 7 et 24, et les sequences peptidiques ou 
les fragments desdites sequences appartenant a une meme famille de proteines choisies 
parmi le perlecan, le precurseur de la proteine plasmatique de liaison au retinol, du 
precurseur de Tactivateur du ganglioside GM2, de la calgranuline B et de la saposine B 

15 (par exemple SEQ ID N"!, SEQ ID N'' 3, SEQ ID N° 5 a 7, SEQ ID N« 10 a 16, SEQ 
ID N° 18 a 23, SEQ ID N° 25 a 29), et les sequences peptidiques qui presentent au 
moins 70 % d'identite de preference au moins 80 % d'identite et avantageusement au 
moins 98 d'identite avec I'une quelconque des sequences peptidiques SEQ ID N** 1 a 
29, seules ou en combinaison, 

20 (ii) soit au moins un fragment naturel et/ou synthetique de ces proteines 

d'interet, par exemple un fragment immunogene capable d'induire une reponse immune 
contre un polypeptide cible, 

(iii) soit au moins un peptide mimotope deflni a partir des sequences de 
reference SEQ ID N° 2, 4, 8, 9, 17 et 24 et les sequences peptidiques ou les fragments 

25 desdites sequences appartenant a une meme famille de proteines choisies parmi le 
perlecan, le precurseur de la proteine plasmatique de liaison au retinol, du precurseur de 
Tactivateur du ganglioside GM2, de la calgranuline B et de la saposine B (par exemple 
SEQ ID N**!, SEQ ID N*» 3, SEQ ID N'=* 5 a 7, SEQ ID NMO a 16, SEQ ID NM8 a 23. 
SEQ ID N° 25 a 29), et les sequences peptidiques qui presentent au moins 70 % 

30 d'identite de preference au moins 80 % d'identite et avantageusement au moins 98 
d'identite avec Tune quelconque des sequences peptidiques SEQ ID N** I a 29, ou une 
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combinaison de mimotopes, capable d'induire une reponse immune centre le polypeptide 
cible, 

(iv) soil au moins toute proteine ou peptide pouvant reguler in vivo ia 
transcription et/ou la traduction des proteines d'interet (SEQ ID N** 2, 4, 8, 9, 17 et 24) 
5 et les sequences peptidiques ou les fragments desdites sequences appartenant a une 
meme famille de proteines choisies parmi le perlecan, le precurseur de la proteine 
plasmatique de liaison au retinol, du precurseur de I'activateur du ganglioside GM2, de 
la calgranuline B et de la saposine B (par example SEQ ID N*l, SEQ ID N° 3, SEQ ID 
N° 5 a 7, SEQ ID NMO a 16, SEQ ID 18 a 23, SEQ ID N° 25 a 29) et les sequences 
10 peptidiques qui presentent au moins 70 % d'identite de preference au moins 80 % 
dMdentite et avantageusement au moins 98 d'identite avec Tune quelconque des 
sequences peptidiques SEQ ID N*" 1 a 29. L' administration de ces proteines et/ou 
peptides seuls ou en combinaison peut retablir la concentration d'une proteine d'interet 
dans I'organisme. 

15 La reponse immune dirigee contre un antigene specifique peut etre divisee 

en deux categories distinctes. Tune mettant en jeu les anticorps (reponse immune de 
type humoral e), T autre les cellules effectrices cytotoxiques telles que par exemple les 
macrophages, les lymphocytes cytotoxiques (CTL) ou les cellules tueuses (NK) ainsi 
que les lymphocytes T « helper », notamment les lymphocytes T CD4+ (reponse 

20 immune de type cellulaire). Plus particulierement, les deux types de reponse se 
distinguent en ce que les anticorps reconnaissent les antigenes sous leur forme 
tridimensionnelle alors que les lymphocytes T, par exemple, reconnaissent des portions 
peptidiques desdits antigenes, associes a des glycoproteines codecs par les genes du 
complexe majeur d'histocompatibilite (CMH), notamment les genes du complexe majeur 

25 d'histocompatibilite de type I qui sont exprimes de fagon ubiquitaire a la surface des 
cellules ou les genes du complexe majeur d'histocompatibilite de type II qui sont 
exprimes de fagon specifique a la surface des cellules impliquees dans la presentation des 
antigenes (APC). I) Selon un premier aspect, la reponse immune de type cellulaire est 
caracterisee en ce que les cellules T de type CD4+ (cellules T 'helper'), suite a un 

30 phenomene deactivation bien connu (pour une revue voir Alberola-lia 1997, Annu Rev 
Immunol 15, 125-154) produisent des cytokines qui a leur tour induisent la proliferation 
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de cellules APC capables de produire lesdites cytokines, la differenciation cellulaire des 
lymphocytes B capables de produire des anticorps specifiques de Tantigene, et la 
stimulation des lymphocytes T cytotoxiques (CTL). 2) Selon un second aspect de la 
reponse immune cellulaire, les cellules effectrices cytotoxiques telles que par exemple les 
5 lymphocytes de type CD8+ (CTL) sont actives a) apres interaction avec des peptides 
antigeniques fixes sur et presentes par les glycoproteines portees par les cellules 
ubiquitaires et codecs par les genes appartenant au systeme CMHI, et b) eventuellement 
par les cytokines produites par les CD4+. 

La presente invention concerne T administration d*une proteine ou d'un 

10 peptide derives des proteines d*interet (SEQ TD N° 2, 4, 8, 9, 17 et 24) ou de leur(s) 
fragment(s), et les sequences peptidiques ou les fragments desdites sequences 
appartenant a une meme famille de proteines choisies parmi le perlecan, le precurseur de 
la proteine plasmatique de liaison au retinol. du precurseur de Tactivateur du ganglioside 
GM2, de la calgranuUne B et de la saposine B (par exemple SEQ ID N"*!, SEQ ID N° 3, 

15 SEQ ID N° 5 a 7, SEQ ID NMO a 16, SEQ ID N° 18 a 23, SEQ ID 25 a 29), et les 
sequences peptidiques qui presentent au moins 70 % d'identite de preference au moins 
80 % d'identite et avantageusement au moins 98 d'identite avec I*une quelconque des 
sequences peptidiques SEQ ID N** I a 29, seuls ou en combinaison, pour la prophylaxie 
et/ou la therapie d*une maladie auto-immune, telle que la sclerose en plaques. Ces 

20 procaines et peptides administres sont caract^rises en ce que ils doivent avoir perdu leur 
activite toxique, par exemple leur activite gliotoxique, ou avoir perdu leur capacite a se 
fixer a un ligand, et peuvent induire significativement une reponse immune mediee par 
les lymphocytes T ou/et les anticorps dirigee contre cette proteine sont utilises. De telles 
proteines sont dites *modifiees', cependant leur immunogenicite est conservee. De telles 

25 molecules immunogeniques modifiees sont obtenues par un nombre de traitements 
conventionnels, par exemple la denaturation chimique ou a la chaleur, la troncation ou la 
mutation avec deletion, insertion ou emplacement d'acides amines. Un exemple de 
troncation consiste en la troncation d*acides amines a Textremite carboxy-terminale 
pouvant aller jusqu'a 5-30 acides amines. Les molecules modifiees peuvent etre obtenues 

30 par des techniques synthetiques ou/et recombinantes ou par des traitements chimiques 
ou physiques des molecules naturelies. 
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Les proteines d'interet naturelles et/ou recombinantes identifiees dans la 
presente invention (SEQ ID N** 2, 4, 8, 9, 17 et 25), et les sequences peptidiques ou les 
fragments desdites sequences appartenant a une meme famiUe de proteines choisies 
parmi le periecan, le precurseur de la proteine plasmatique de liaison au retinol, du 
5 precurseur de Tactivateur du ganglioside GM2, de la calgranuline B et de la saposine B 
(par exemple SEQ ID N'^i, SEQ ID N° 3, SEQ ID 5 a 7, SEQ ID 10 a 16, SEQ 
ID N° 18 a 23, SEQ ID N° 25 a 29), et les sequences peptidiques qui presentent au 
moins 70 % d'identite de preference au moins 80 % d'identite et avantageusement au 
moins 98 d'identite avec Tune quelconque des sequences peptidiques SEQ ID N° 1 a 

10 29, ou leur(s) fragment(s), sont utilisees en vaccination prophylactique et therapeutique 
centre les maladies auto-immunes, de preference la SEP. Un vaccin comprend une 
quantite immunogenique effective de la proteine immunogene en association avec un 
vehicule pharmaceutiquement acceptable et eventuellement un adjuvant et/ou un diluant. 
Les vehicules, adjuvants et diluants pharmaceutiquement acceptables sont bien connus 

15 de I'homme du metier. On peut citer a titre de reference le Remington's Pharmaceutical 
Sciences. L'utilisation de compositions vaccinales est particulierement avantageuse en 
association avec un diagnostic precoce de la maladie. La proteine immunogene est 
utilisee dans la preparation de medicament pour la vaccination prophylactique ou 
therapeutique. Les proteines d'interet peuvent etre eliminees de Torganisme sans induire 

20 d'effets secondaires indesirables. L' identification de telles proteines ou peptides vaccins 
est realisee comme suit : ies molecules candidates modiftees comme decrit 
precedemment (proteines naturelles, recombinantes, peptides) sont analysees dans un 
test fonctionnel pour verifier qu'elles ont perdues leur toxicite. par exemple leur activite 
gliotoxique en utilisant le test appele bio-essai, et pour verifier leur immunogenicite (i) 

25 en realisant un test in vitro de proliferation de lymphocytes T CD4+ specifiques de 
Tantigene administre (T cell assay) ou un test in vitro de cytotoxicite des lymphocytes 
CD8+ specifiques de I'antigene administre et(ii) en mesurant entre autre le taux 
d'anticorps circulants diriges centre la proteine naturelle. Ces formes modifiees sont 
utilisees pour immuniser des hommes par des procedures standard avec des adjuvants 

30 appropries. 
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Les vaccins prepares sont injectables, c'est-a-dire en solution liquide ou en 
suspension. En option, la preparation peut aussi etre emulsiflee. La molecule antigenique 
peut etre melangee avec des excipients qui sont pharmaceutiquement acceptables at 
compatibles avec Tingredient actif. Des exemples d'excipients favorables sont I'eau, une 

5 solution saline, le dextrose, le glycerol, Tethanol ou des equivalents et leurs 
combinaisons. Si desire, le vaccin peut contenir des quantites mineures de substances 
auxiliaires comme des agents « wetting » ou emulsifiants, des agents qui tamponnent le 
pH ou des adjuvants comme Thydroxide d 'aluminium, le dipeptide muramyl ou leurs 
variations. Dans le cas des peptides, leur couplage a une plus grosse molecule (KLH, 

10 toxine tetanique) augmente quelquefois rimmunogenicite. Les vaccins sont administres 
conventionneilement par injection par exemple sous cutanee ou intramusculaire. Des 
formulations additionnelles favorables avec d'autres modes d*administration inciuent des 
suppositoires et quelquefois des formulations orales. 

En general la concentration du polynucleotide dans la composition utilisee 

15 pour une administration /// vivo est de 0. 1 ^g /ml jusqu'a 20 mg /ml. Le polynucleotide 
peut etre homologue ou heterologue de la cellule cible dans laquelle il va etre introduit. 

La presente invention concerne egalement Putilisation de vaccins incluant 
des molecules d'acides nucleiques qui codent pour les proteines d'interet ou des 
peptides immunogenes ou leur fragment(s), non actifs, correspondant aux proteines 

20 d'interet (SEQ ID N° 2, 4, 8, 9, 17 et 24) et les sequences peptidiques ou les fragments 
desdites sequences appartenant a une meme famille de proteines choisies parmi le 
perlecan, le precurseur de la proteine plasmatique de liaison au retinol, du precurseur de 
Tactivateur du ganglioside GM2, de la calgranuline B et de la saposine B (par exemple 
SEQ ID N°l, SEQ ID 3, SEQ ID N« 5 a 7, SEQ ID N° 10 a 16, SEQ ID N° 18 a 23, 

25 SEQ ID N** 25 a 29) et les sequences peptidiques qui presentent au moins 70 % 
d'identite de preference au moins 80 % d'identite et avantageusement au moins 98 
d'identite avec Tune quelconque des sequences peptidiques SEQ ID N° 1 a 29. Les 
vaccins d'acides nucleiques, en particulier les vaccins ADN, sont administres 
generalement en association avec un vehicule pharmaceutiquement acceptable en 

30 injection intramusculaire. 
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A partir de la sequence en acides amines des proteines d'interet decrites 
(SEQ ID N° 2, 4, 8, 9, 17 et 24) et les sequences peptidiques ou les fragments desdites 
sequences appartenant a une meme famille de proteines choisies parmi le perlecan, le 
precurseur de la proteine plasmatique de liaison au retinol, du precurseur de Tactivateur 
5 du ganglioside GM2, de la calgranuline B et de la saposine B (par example SEQ ID N*^l, 
SEQ ID N° 3, SEQ ID N° 5 a 7, SEQ ID N° 10 a 16, SEQ ID N° 18 a 23, SEQ ID N** 
25 a 29) et les sequences peptidiques qui present ent au moins 70 % d'identite de 
preference au moins 80 % d'identite et avantageusement au moins 98 d*identite avec 
Tune quelconque des sequences peptidiques SEQ ID N° 1 a 29, des peptides ou des 

10 fragments correspondant a tout ou partie de la sequence primal re de ces proteines 
peuvent etre synthetises par des methodes classiques de synthese peptidique ou obtenus 
par recombinaison genetique. 

Des proteines recombinantes correspondante aux proteines d'interet, 
produites dans un systeme cellulaire procaryote ou eucaryote, sent disponibles aupres de 

15 differentes equipes et sont decrites dans la litterature. Elles peuvent etre egalement 
produite par Fhomme du metier a partir de la connaissance des sequences des genes 
correspondants decrits dans la litterature et en tenant compte de la degenerescence du 
code genetique. Toutes les sequences proteiques identifiees dans la presente invention 
sont ainsi susceptibles d'etre obtenues par recombinaison genetique. Les genes sont 

20 clones dans des vecteurs adaptes. Des vecteurs diflFerents sont utilises pour transformer 
des cellules procaryotes (par exemple E. coli) et des cellules eucaryotes (par exemple 
cellules COS, CHO et cellules Simliki). Les proteines recombinantes correspondant aux 
proteines d'interet ou a des fragments des proteines d'interet peuvent etre ainsi produits 
dans des systemes cellulaires procaryotes et/ou encaryotes. Dans les cellules coli, les 

25 proteines recombinantes sont produites avec une queue poly-histidine. La fraction 
proteique insoluble est solubilisee dans de Turee 8M. L'enrichissement du produit a ete 
efFectue sur resine chelatee au nickel (Qiagen). La colonne a ete lavee avec des 
concentrations decroissantes d'uree. L'elution a ete faite avec de Timidazole en 
Tabsence d'uree. La sequence complete des proteines d'interet peut etre egalement 

30 clonee dans un plamide adapte puis transferee dans le virus de la vaccine pour obtentr un 
virus recombinant. 
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Utilisation de ligands capables de se fixer aux proteines d*interet identifiees 
dans la presente invention. 

La presente invention concerne un materiel biologique pour la preparation 
de compositions pharmaceutiques destinees au traitement de mammiferes attaint de 
maladie auto-immune, de preference la sclerose en plaques, comprenant 

(i) soil au moins un ligand capable de se fixer aux proteines et/ou fragments 
des proteines choisies parmi les proteines cibles SEQ ID N° 2, 4, 8, 9, 14 et 24 et les 
sequences peptidiques ou les fragments desdites sequences appartenant a une meme 
famille de proteines choisies parmi le perlecan, le precurseur de la proteine plasmatique 
de liaison au retinol, du precurseur de Tactivateur du ganglioside GM2, de la 
calgranuline B et de la saposine B (par exemple SEQ ID N°l. SEQ ID N° 3, SEQ ID N** 
5^7. SEQ ID N** 10 a 16, SEQ ID 18 a 23, SEQ ID N« 25 a 29) et les sequences 
peptidiques qui presentent au moins 70 % d'identite de preference au moins 80 % 
d'identite et avantageusement au moins 98 d'identite avec I'une quelconque des 
sequences peptidiques SEQ ID N** 1 a 29. le ligand etant capable ou non d'inhiber 
Pactivite proteique, 

(ii) soit au moins un anticorps polyclonal ou monoclonal capable de se fixer 
a au moins une proteine ou un de ses fragments choisie parmi les proteines cibles SEQ 
ID N° 2, 4, 8, 9, 14 et 24 et les sequences peptidiques ou les fragments desdites 
sequences appartenant a une meme famille de proteines choisies parmi le perlecan, le 
precurseur de la proteine plasmatique de liaison au retinol, du precurseur de Pactivateur 
du ganglioside GM2, de la calgranuline B et de la saposine B (par exemple SEQ ID N"!, 
SEQ ID N° 3, SEQ ID N° 5 a 7. SEQ ID N° 10 a 16, SEQ ID 18 a 23, SEQ ID N° 
25 a 29) et les sequences peptidiques qui presentent au moins 70 % d'identite de 
preference au moins 80 % d'identite et avantageusement au moins 98 d'identite avec 
I'une quelconque des sequences peptidiques SEQ ID N** 1 a 29. Cet anticorps peut etre 
ou non neutralisant, c'est-a-dire capable ou non d'inhiber Tactivite de la proteine 
d'interet. Le ligand peut etre choisi parmi toute molecule ou fragment molecule capable 
de se fixer aux proteines cibles, par exemple les recepteurs de ce proteines, les co- 
facteurs de ces proteines, les anticorps polyclonaux ou monoclonaux capables de se fixer 
aux proteines ou tout fragment de ces proteines. 
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Ces anticorps sont tres utiles notamment pour permettent la mise en oeuvre 
de compositions therapeutiques car ils conduisent par example, a des reactions immunes, 
dirigees specifiquement a i'encontre d'epitopes immunodominants ou centre des 
antigenes presentant une grande variabilite. On administre chez le patient soit des 
5 anticorps solubles neutralisants pour inhiber leur fonction, soit des anticorps solubles 
specifiques pour eliminer le peptide par formation de complexes immuns. L'invention 
decrit Tutilisation d'anticorps capables de reconnaitre specifiquement au moins une 
proteine decrite dans la presente invention pour le traitement et /ou pour le suiyi 
therapeutique de maladie degenerative et/ou neurologique et/ou auto-immune, de 

10 preference la sclerose en plaques. Ces anticorps sont polyclonaux et de preference 
monoclonaux. De preference ces anticorps reconnaissent le site actif de la proteine et en 
se fixant, inhibe la fonction de la proteine. La capacite de Tanticorps a se fixer 
specifiquement a la proteine est analyse par des techniques conventionneile decrites, 
comme par exemple par des tests ELISA ou de Western Blot en utilisant la proteine ou 

15 le peptide immunogene naturel ou synthetique. Le titre de T anticorps est determine. La 
capacite de Tanticorps a neutraliser la fonction de la proteine peut etre analysee par 
differents moyen, par exemple en determinant la diminution de Tactivite de la proteine 
ou du peptide immunogene en presence de 1' anticorps, de preference en determinant la 
diminution de Tactivite gliotoxique en utilisant le test bio-essai in vitro. 

20 Par exemple, les anticorps monoclonaux diriges centre la proteine cible ou 

une partie de cette proteine sont produits par des techniques conventionnelles utilisees 
pour produire des anticorps contre des antigenes de surface Des souris ou des lapins 
sont immunisees (i) soit avec la proteine naturelle ou recombinante d'interet, (ii) soit 
avec tout peptide immunogene de cette proteine d'interet, (iii) soit avec des cellules 

25 murines qui expriment la proteine ou le peptide d'interet et les molecules du CMHII. La 
lignee murine Balb/c est la plus frequemment utilisee. L' immunogene est egalement un 
peptide choisi parmi les peptides definis a partir des sequences primaires des proteines 
d'interet. Par exemple, I'immunogene suivant a ete prepare : les peptides SEQ ID N**s 
58, 59, 60 issus de la sequence du precurseur du ganglioside GM2, les peptides SEQ ID 

30 N°s 61, 62 issus de la sequence de la saposine B et les peptides SEQ ID N°s 63, 64, 65 
issus de la calgranuline B ont ete couple a de Themocyanine de Lymphet Keyhole, en 
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abrege peptide-KLH, comme support pour son utilisation en immunisation, ou couple a 
de Talbumine de serique humaine, en abrege peptide-HSA. Les animaux ont ete soumis 
a une injection de peptide -KLH ou de peptide -HSA en utilisant de Tadjuvant complet 
de Freund (IF A). Les serums et les surnageants de culture d*hybridome issus des 
5 animaux immunises avec chaque peptide ont ete analyses pour la presence d*anticorps 
anti-proteines par un test ELISA utilisant les proteines initiales. Les cellules spleniques 
de ces souris ont par consequent ete recuperees et fusionnees avec des cellules de 
myeloma. Le polyethyleneglycol (PEG) est Kagent de fusion le plus frequemment utilise. 
Les hybridomes produisant les anticorps les plus specifiques et les plus sensibles sont 

10 selectionnes. Les anticorps monoclonaux peuvent etre produits in vitro par culture 
celluiaire des hybridomes produits ou par recuperation de liquide d*ascite murin apres 
injection intraperitoneale des hybridomes chez la souris. Quel que soit le mode de 
production en surnageant ou en ascite, il importe ensuite de purifier I'anticorps 
monoclonal. Les methodes de purification utilisees sont essentiellement la filtration sur 

15 gel echangeur dMons ou par chromatographie d'exclusion, voire I'immunoprecipitation. 
Pour chaque anticorps il faut choisir la methode qui permettra d'obtenir le meilleur 
rendement. Un nombre suffisant d* anticorps anti-proteines sont cribles dans des tests 
fonctionnels pour identifier les anticorps les plus performants pour fixer la proteine 
d'interet et/ou pour bloquer Tactivite de la proteine d'interet. Les anticorps 

20 monoclonaux selectionnes sont humanises par des methodes standard de « CDR 
grafting » (protocole realise par de nombreuses compagnies, sous forme de service), Ces 
anticorps humanises peuvent etre testes cliniquement chez le patient. L'eflficacite de ces 
anticorps peut etre suivie par des parametres cliniques. 

La production /// vifro d'anticorps, de fragments d'anticorps ou de derives 

25 d'anticorps, tels que les anticorps chimeres, produits par genie genetique, dans des 
cellules eucaryotes a ete decrite (HP 120 694 ou EP 125 023) et est aussi applicable a la 
presente invention. 

Utilisation de molecules inhibitrices des proteines dMnteret identifiees dans 
la presente invention. 

30 La presente invention concerne un materiel biologique pour la preparation 

de compositions pharmaceutiques destinees au traitement de mammiferes atteint de 
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maladie degenerative et/ou neurologique et/ou auto-immune, de preference la sclerose 
en plaques, ladite composition comprenant (i) soit au moins une molecule inhibitrice de 
la fonction d'au moins une proteine choisie parmi les proteines identifiees dans la 
presente invention (SEQ ID N° 2, 4, 8, 9, 17, 24) et les sequences peptidiques ou les 
5 fragments desdites sequences appartenant a une meme famille de proteines choisies 
parmi le perlecan, le precurseur de la proteine plasmatique de liaison au retinol, du 
precurseur de I'activateur du ganglioside GM2, de la calgranuline B et de la saposine B 
(par exemple SEQ ID N**l, SEQ ID N*' 3, SEQ ID N*' 5 a 7, SEQ ID N*^ 10 a 16, SEQ 
ID N° 18 a 23, SEQ ID N** 25 a 29) et les sequences peptidiques qui presentent au 

10 moins 70 % d'identite de preference au moins 80 % d'identite et avantageusement au 
moins 98 d*identite avec Tune quelconque des sequences peptidiques SEQ ID N** 1 a 
29, par exemple inhibitrice de Tactivite gliotoxique, (ii) soit au moins une molecule 
regulatrice de I'expression d'au moins une proteine choisie parmi les proteines SEQ ID 
N° 2, 4, 8, 9, 1 7, 24 et les sequences peptidiques ou les fragments desdites sequences 

15 appartenant a une meme famille de proteines choisies parmi le perlecan, le precurseur de 
la proteine plasmatique de liaison au retinol, du precurseur de Tactivateur du ganglioside 
GM2, de la calgranuline B et de la saposine B (par exemple SEQ ID N**l, SEQ ID N** 3, 
SEQ ID N'' 5 a 7, SEQ ID N° 10 a 16, SEQ ID N° 18 a 23, SEQ ID N° 25 a 29) et les 
sequences peptidiques qui presentent au moins 70 % d'identite de preference au moins 

20 80 % d'identite et avantageusement au moins 98 d'identite avec Tune quelconque des 
sequences peptidiques SEQ ID N° 1 a 29, par exemple pour bloquer la transcription ou 
la traduction, (iii) soit au moins une molecule regulatrice du metabolisme d'au moins 
une proteine choisie parmi les proteines SEQ ID 2, 4, 8, 9, 17, 24 et les sequences 
peptidiques ou les fragments desdites sequences appartenant a une meme famille de 

25 proteines choisies parmi le perlecan, le precurseur de la proteine plasmatique de liaison 
au retinol, du precurseur de Tactivateur du ganglioside GM2, de la calgranuline B et de 
la saposine B (par exemple SEQ ID N°l, SEQ ID N° 3, SEQ ID N** 5 a 7, SEQ ID N*' 
10 a 16, SEQ ID N** 18 a 23, SEQ ID N° 25 a 29) et les sequences peptidiques qui 
presentent au moins 70 % d'identite de preference au moins 80 % d'identite et 

30 avantageusement au moins 98 d'identite avec Tune quelconque des sequences 
peptidiques SEQ ID N° 1 a 29, (iv) soit au moins une molecule regulatrice de 
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Texpression et/ou du metabolisme d'un ligand d'au moins une proteine choisie parmi les 
proteines SEQ ID N° 2, 4, 8, 9, 17, 24 et les sequences peptidiques ou les fragments 
desdites sequences appartenant a une meme famille de proteines choisies parmi le 
perlecan, le precurseur de la proteine plasmatique de liaison au retinol. du precurseur de 
5 Tactivateur du ganglioside GM2. de la calgranuline B et de la saposine B (par exemple 
SEQ ID N°l, SEQ ID N° 3, SEQ ID N° 5 a 7, SEQ ID N*' 10 a 16, SEQ ID N** 18 a 23, 
SEQ ID N° 25 a 29) et les sequences peptidiques qui presentent au moins 70 % 
d'identite de preference au moins 80 % d'identite et avantageusement au moins 98 
d'identite avec Tune quelconque des sequences peptidiques SEQ ID N*^ 1 a SEQ ID N° 

10 8 et SEQ ID N° 10 a 29 et les sequences peptidiques qui presentent au moins 70 % 
u SueniUC ciC prcicrcncc au moms o\j /u d'identite et avantageusement au moins 98 
d'identite avec I'une quelconque des sequences peptidiques SEQ ID N° 1 a 29, par 
exemple un recepteur ou un co-facteur. On peut penser que ces proteines de Torganisme 
humain peuvent etre inhibees sans effet secondaire. 

15 Un autre aspect important de Tinvention concerne identification et 

revaluation de Tefficacite therapeutique de substances naturelles et/ou synthetiques (i) 
capables de bloquer et/ou d'inhiber Tactivite des proteines d'interet de Tinvention et/ou 
de leur fragment : SEQ ID N° 2, 4, 8, 9, 17, 24 et les sequences peptidiques ou les 
fragments desdites sequences appartenant a une meme famille de proteines choisies 

20 parmi le perlecan, le precurseur de la proteine plasmatique de liaison au retinol, du 
precurseur de Tactivateur du ganglioside GM2, de la calgranuline B et de la saposine B 
(par exemple SEQ ID N°l. SEQ ID N** 3. SEQ ID N** 5 a 7. SEQ ID 10 a 16, SEQ 
ID 18 a 23, SEQ ID N** 25 a 29) et les sequences peptidiques qui presentent au 
moins 70 % d'identite de preference au moins 80 % d'identite et avantageusement au 

25 moins 98 d'identite avec Tune quelconque des sequences peptidiques SEQ ID N° 1 a 29 
et/ou (ii) capables d'inhiber leur metabolisme tels les inhibiteurs du metabolisme 
correspondant, les inhibiteurs d'enzymes activees par les co-enzymes, (iii) capables de 
reguler I'expression des proteines d'interet (SEQ ID N° 2, 4, 8, 9, 17, 24 et les 
sequences peptidiques ou les fragments desdites sequences appartenant a une meme 

30 famille de proteines choisies parmi le perlecan, le precurseur de la proteine plasmatique 
de liaison au retinol, du precurseur de I'activateur du ganglioside GM2, de la 
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calgranuline B et de la saposine B (par exemple SEQ ID N°l, SEQ ID N° 3, SEQ ID N° 
5 a 7, SEQ ID N° 10 a 16, SEQ ID N° 18 a 23, SEQ ID N° 25 a 29) et les sequences 
peptidiques qui presentent au moins 70 % d'identite de preference au moins 80 % 
d'identite et avantageusement au moins 98 d'identite avec I'une quelconque des 
5 sequences peptidiques SEQ ID N** 1 a 29, (iv) capables d'inhiber la fonction et/ou 
Texpression des ligands des proteines d'interet SEQ ID N** 2, 4, 8, 9, 17, 24 et les 
sequences peptidiques ou les fragments desdites sequences appartenant a une meme 
famille de proteines choisies parmi le perlecan, le precurseur de la proteine plasmatique 
de liaison au retinol, du precurseur de Pactivateur du ganglioside GM2, de la 

10 calgranuline B et de la saposine B (par exemple SEQ ID N°l, SEQ ID N° 3, SEQ ID N° 
5 a 7, SEQ ID N° 10 a 16, SEQ ID N° 18 a 23, SEQ ID N° 25 a 29) et les sequences 
peptidiques qui presentent au moins 70 % d'identite de preference au moins 80 % 
d'identite et avantageusement au moins 98 d'identite avec Tune quelconque des 
sequences peptidiques SEQ ID 1 a 29, comme par exemple des recepteurs. Ces 

15 substances peuvent etre utilisees dans des traitements prophylactjques et therapeutiques 
de la maladie. L' invention concerne egalement des methodes pour trailer et prevenir une 
maladie auto-immune, par exemple la SEP, en administrant des quantites effectives de 
ces substances, Les substances peuvent etre des proteines, des anticorps. de petites 
molecules synthetiques ou naturelles, des derives des proteines identifiees dans cette 

20 invention, des lipides, des glycolipides etc Les petites molecules peuvent etre 

criblees et identifiees en grande quantite en utilisant des librairies combinatoires 
chimiques. L'invention concerne egalement des compositions pharmaceutiques 
comprenant ces substances en association avec des carriers physiologiques acceptables, 
et des methodes pour la preparation de medicaments a utiliser en therapie ou en 

25 prevention de maladies auto-immunes dont la SEP en utilisant ces substances. 

Pour identifier des molecules inhibitrices de faible poids moleculaire 
comme des drogues candidates pour les maladies degeneratives et/ou neurologiques 
et/ou auto-immunes, telles que la sclerose en plaques, on utilise les tests et protocoles 
decrits dans precedemment et dans les demandes de brevet incorpores a titre de 

30 reference, en utilisant des echantillons preleves du patient non traite ou traite, du modele 
animal non traite ou traite, ou de tissus du modele animal non traite ou traite. Cet aspect 
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de I 'invention indue egalement un precede pour identifier des substances capables de 
bloquer ou d'inhiber Tactivite des proteines d'interet, comprenant rintroduction de ces 
substances dans un test in vitro ou dans un modele animal /// vivo. Les molecules 
selectionnees sont testees a differentes concentrations. Ces inhibiteurs sont aussi testes 
5 dans des essais de toxicite et pharmacocinetique pour savoir si ils peuvent representer 
des drogues candidates valables. Les substances testees pour T inhibition ou le blocage 
des activites proteiques ou de Texpression des proteines, dans ces procedures de 
criblage peuvent etre des proteines, des anticorps, des fragments d'anticorps, de petites 
molecules synthetiques ou naturelles, des derives des proteines dMnteret, etc Les 

10 petites molecules peuvent etre criblees et identifiees en grande quantite en utilisant des 
librairies combinatoires chimiques. 

A titre d'exemple, on peut citer comiTie substances inhibitrices : 
Les inhibiteurs des proteines identifiees dans la presente invention (SEQ ID 
N° 2, 4, 8, 9, 17, 24), les sequences peptidiques ou les fragments desdites sequences 

15 appartenant a une meme famille de proteines choisies parmi le perlecan, le precurseur de 
la proteine plasmatique de liaison au retinol. du precurseur de Tactivateur du ganglioside 
GM2, de la calgranuline B et de la saposine B (par exemple SEQ ID N°l, SEQ ID N° 3, 
SEQ ID N** 5 a 7, SEQ ID N° 10 a 16. SEQ ID N° 18 a 23, SEQ ID N° 25 a 29) et les 
sequences peptidiques qui presentent au moins 70 % d'identite de preference au moins 

20 80 % d'identite et avantageusement au moins 98 d'identite avec Tune quelconque des 
sequences peptidiques SEQ ID N° 1 a 29, et les inhibiteurs des fragments desdites 
proteines. Ces inhibiteurs peuvent etre compris dans une composition prophylactique et 
therapeutique, en particulier pour le traitement de la sclerose en plaques. Par exemple la 
lycorine, alcaloTde extrait de Amaryllidaceae (ex Crinum Asiaticum) est utilisee in vitro a 

25 une concentration comprise entre 0.1 et 0.5 jig /ml et in vivo a une concentration 
comprise entre 0. 1 et 1 mg / kg /jour. Par exemple, le Rolipram (nom commercial) et 
I'Ibudilast (nom commercial), qui sont deux molecules de la meme famille des inhibiteurs 
des phosphodiesterases 4(PDE4) sont utilisees in vitro a des concentrations comprises 
entre 1 et 10 jiM/I et in vivo a des concentrations comprises entre environ 10 mg / kg 

30 /jour. 
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^ A partir des sequences d'acides amines des proteines SEQ ID N*' 2,^4, 
8, 9, 17, 24_et des sequences peptidiques ou les fragments desdites sequences 
appartenant a une meme famille de proteines choisies parmi le perlecan, le precurseur de 
la proteine plasmatique de liaison au retinol, du precurseur de Tactivateur du ganglioside 
5 GM2, de la calgranuline B et de la saposine B (par exemple SEQ ID SEQ ID N° 3, 
SEQ ID N° 5 a 7, SEQ ID N° 10 a 16, SEQ ID N° 18 a 23, SEQ ID N° 25 a 29)J1 est 
evident que Ton peut deduire les sequences nucleotidiques ADN et ARN (SEQ ID N** 
30, 31, 42, 53) correspondant aux proteines d'interet et les sequences codant pour les 
proteines de la famille de ces proteines d*interet ( par exemple SEQ ID N° 32 a 41, SEQ 
10 ID N° 43 a 52, SEQ ID N° 54 a 57, SEQ ID N° 66 a 67), en tenant compte du code 
genetique et de sa degenerescence. Ainsi la presente invention concerne T utilisation de 
ces sequences nucleotidiques sous forme 

- de sequences anti-sens 

- de sequences codant pour un gene therapeutique 

15 -de sequences pouvant etre contenue dans un vecteur pour la realisation de 

transformation cellulaire ex vitro et/ou in vivo (therapie genique) 

Utilisation d*acides nucleiques deduits des sequences en acides amines des 
proteines d'interet identifiees dans la presente invention ; acides nucleiques anti-sens 
et/ou codant pour un gene therapeutique. 

20 La presente invention concerne un materiel biologique pour la preparation 

de compositions pharmaceutiques destinees au traitement de mammiferes atteint de 
maladie degenerative et/ou neurologique et/ou auto-immune, en particulier la sclerose en 
plaques, la composition comprenant (i) soit au moins une sequence d'acide nucleique 
capable de s'hybrider a une sequence d'acides nucleiques codant pour les proteines 

25 d'interet (SEQ ID N° 2, 4, 8, 9, 17, 24) et les sequences peptidiques ou les fragments 
desdites sequences appartenant a une meme famille de proteines choisies parmi le 
perlecan, le precurseur de la proteine plasmatique de liaison au retinol, du precurseur de 
Tactivateur du ganglioside GM2, de la calgranuline B et de la saposine B (par exemple 
SEQ ID N°l, SEQ ID N*' 3, SEQ ID N° 5 a 7, SEQ ID N° 10 a 16, SEQ ID N° 18 a 23. 

30 SEQ ID N° 25 a 29) et les sequences peptidiques qui presentent au moins 70 % 
d'identite de preference au moins 80 % d'identite et avantageusement au moins 98 
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d'identite avec Tune quelconque des sequences peptidiques SEQ ID N° 1 a 29, ou 
leur(s) fragment(s), (ii) soit au moins une sequence d'acide nucleique comprenant au 
moins un gene d'interet therapeutique codant pour les proteines ou un fragment de 
proteines (SEQ ED N° 2, 4, 8, 9. 17, 24), les sequences peptidiques ou les fragments 
5 desdites sequences appartenant a une meme famille de proteines choisies parmi le 
perlecan, le precurseur de la proteine plasmatique de liaison au retinol, du precurseur de 
Tactivateur du ganglioside GM2, de la calgranuline B et de la saposine B (par exemple 
SEQ ID N°l, SEQ ID N** 3. SEQ ID N° 5 a 7, SEQ ID 10 a 16, SEQ ID N° 18 a 23, 
SEQ ID N° 25 a 29) et les sequences peptidiques qui presentent au moins 70 % 

10 d'identite de preference au moins 80 % d'identite et avantageusement au moins 98 
d'identite avec !'une quelconque des sequences peptidiques SEQ ID N** I a 29, et des 
elements assurant {'expression dudit gene in vivo dans des cellules cibles destinees a etre 
genetiquement modifiees par ladite sequence nucleique. 

Par sequence d*acide nucleique, on entend un fragment d'ADN et/ou 

15 d' ARN, double brin ou simple brin. lineaire ou circulaire, naturel et isole ou de synthese, 
destgnant un enchamement precis de nucleotides, modifies ou non, permettant de definir 
un fragment ou une region d'un acide nucleique choisi dans le groupe consistant en un 
cDNA ; un ADN genomique ; un ADN plasmidique ; un ARN messager. Ces sequences 
d'acides nucleiques sont deduites de la sequence d*acides amines des proteines SEQ ID 

20 N° 2, 4, 8, 9, 17, 24 et les sequences peptidiques ou les fragments desdites sequences 
appartenant a une meme famille de proteines choisies parmi le perlecan, le precurseur de 
la proteine plasmatique de liaison au retinol, du precurseur de Tactivateur du ganglioside 
GM2, de la calgranuline B et de la saposine B (par exemple SEQ ID N^^l, SEQ ID N*" 3, 
SEQ ID N° 5 a 7, SEQ ID N° 10 a 16, SEQ ID N° 18 a 23, SEQ ID N° 25 a 29) et les 

25 sequences peptidiques qui presentent au moins 70 % d'identite de preference au moins 
80 % d'identite et avantageusement au moins 98 d'identite avec Tune quelconque des 
sequences peptidiques SEQ ID N** 1 a 29, en utilisant le code genetique. En raison de la 
degenerescence du code genetique T invention englobe egalement des sequences 
equivalentes ou homologues. Ces sequences definies permettent a Thomme de Tart de 

30 definir lui-meme les acides nucleiques adaptes. 
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Aussi, la presente invention concerne un materiel biologique pour la 
preparation de compositions pharmaceutiques comprenant au moins une sequence 
d'acide nucleique capable de s'hybrider a une sequence d'acides nucleiques codant pour 
les proteines d'interet ou leur(s) fragment(s) (SEQ ID N° 2, 4, 8, 9, 17, 24) et les 
sequences peptidiques ou les fragments desdites sequences appartenant a une meme 
famille de proteines choisies parmi !e perlecan, le precurseur de la proteine plasmatique 
de liaison au retinol, du precurseur de Tactivateur du ganglioside GM2, de la 
calgranuline B et de la saposine B (par exemple SEQ ID N°l, SEQ ID N** 3, SEQ ID N° 
5 a 7, SEQ ID 10 a 16, SEQ ID N° 1 8 a 23. SEQ ID N° 25 a 29) et les sequences 
peptidiques qui presentent au moins 70 % d'identite de preference au moins 80 % 
d'identite et avantageusement au moins 98 d'identite avec Tune quelconque des 
sequences peptidiques SEQ ID N° I a 29. 

L'invention consiste a definir et utiliser des molecules d'acides nucleiques 
complementaires des sequences ADN et/ou ARN codant pour les proteines d'interet ou 
leur(s) fragment(s). Ces fragments correspondent a des molecules anti-sens ou ribozyme 
et peuvent etre synthetises a Taide de synthetiseurs automatiques, tels que ceux 
commercialises par la societe Applied Biosystem. LMnvention decrit Tutilisation de ces 
acides nucleiques capables de s'hybrider dans des conditions stringentes a I'ADN ou/et 
ARN codant pour les proteines de 1' invention ou pour leu(s) fragment(s), Des 
conditions de stringence caracteristiques sont celles qui correspondent a une 
combinaison de la temperature et de la concentration saline choisie approximativement 
entre 12 a 20X sous le Tm ('melting temperature') de I'hybride a Tetude. De telles 
molecules sont synthetisees et peuvent etre marquees en utilisant des methodes de 
marquage conventionnelles utilisees pour les sondes moleculaires, ou peuvent etre 
utilisees comme amorces dans les reactions d' amplification. Les sequences qui 
presentent au moins 90% d'homologie par rapport a une sequence de reference font 
egalement partie de J 'invention, de meme que les fragments de ces sequences qui 
presentent au moins 20 nucleotides et de preference 30 nucleotides contigus 
homologues par rapport a une sequence de reference. Afin de reduire la proportion de 
peptides naturels ou variants, il est possible d'envisager une approche anti-sens et/ou 
ribozyme. Une telle approche est largement decrite dans la litterature. Bien entendu, de 
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telles molecules anti-sens peuvent constituer en tant que telles des vecteurs. On peut 
egalement utiliser des vecteurs qui comprennent une sequence d'acides nucleique qui 
code pour un anti-sens. 

La presente invention concerne un materiel biologique pour la preparation 
5 de compositions pharmaceutiques destinees au traitement de mammiferes attaint de 
maladie degenerative et/ou neurologique et/ou auto-immune, telle que la sclerose en 
plaques, ladite composition comprenant au moins une sequence d'acide nucleique 
contenant au moins un gene d'interet therapeutique et des elements assurant Texpression 
dudit gene in vivo dans des cellules cibles destinees a etre genetiquement modifiees par 
10 ladite sequence nucleique. 

Ces sequences d'acides nucleiques et/ou vecteurs (anti-sens ou codant pour 
une proteine ou un fragment d'une proteine) permettent de cibler les cellules dans 
lesquelles le peptide est exprime, telles que les cellules macrophages : (i) soit par 
I'utilisation d'une molecule de ciblage introduite sur le vecteur, (ii) soit par Tutilisation 
IS d*une propriete particuliere de ces cellules. 

Utilisation de vecteurs comprenant un gene d'interet therapeutique 
correspondant aux genes des proteine d'interet identifiees dans la presente invention. 

La presente invention concerne un materiel biologique pour la preparation 
de compositions pharmaceutiques destinees a la prevention et au traitement de maladies 
20 degenerative et/ou neurologique et/ou auto-immune, telles que la sclerose en plaques, la 
composition comprenant une sequence d'acide nucleique comprenant un gene d'interet 
therapeutique et des elements d' expression dudit gene d'interet. Les genes peuvent etre 
non mutes ou mutes. lis peuvent egalement consister en des acides nucleiques modifies 
de sorte qu'il ne leur est pas possible de s'integrer dans le genome de la cellule cible ou 
25 des acides nucleiques stabilises a Taide d'agents, tels que la spermine. 

Un tel gene d'interet therapeutique code notamment : 
(i) soit au moins pour une proteine choisie parmi les proteines identifiees 
dans la presente invention (SEQ ED N° 2, 4, 8, 9, 1 7, 24) et les sequences peptidiques 
ou les fragments desdites sequences appartenant a une meme famille de proteines 
30 choisies parmi le perlecan, le precurseur de la proteine plasmatique de liaison au retinol, 
du precurseur de I'activateur du ganglioside GM2. de la calgranuline B et de la saposine 
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B (par exemple SEQ ID N^l, SEQ ID N** 3, SEQ ID N« 5 a 7, SEQ ID N° 10 a 16, 
SEQ ID N° 18 a 23, SEQ ID N° 25 a 29) et les sequences peptidiques qui presentent au 
moins 70 % d'identite de preference au moins 80 % d'identite et avantageusement au 
moins 98 d'identite avec I'une quelconque des sequences peptidiques SEQ ID N** 1 a 
5 29, ou leur(s) fragment(s), 

(ii) soit au moins pour tout ou partie d'un anticorps polyclonal ou 
monoclonal capable de se fixer a au moins une proteine ou un fragment de proteine 
choisi parmi les proteines identifiees dans la presente invention (SEQ ID N*' 2, 4, 8, 9, 
17, 24) et les sequences peptidiques ou les fragments desdites sequences appartenant a 

10 une meme famille de proteines choisies parmi le perlecan, le precurseur de la proteine 
plasmatique de liaison au retinol, du precurseur de I'activateur du ganglioside GM2, de 
la calgranuline B et de la saposine B (par exemple SEQ ID N°l, SEQ ID N° 3, SEQ ID 
N** 5 a 7, SEQ ID N° 10 a 16, SEQ ID N'' 18 a 23. SEQ ID N° 25 a 29) et les sequences 
peptidiques qui presentent au moins 70 % d'identite de preference au moins 80 % 

15 d'identite et avantageusement au moins 98 d'identite avec I'une quelconque des 
sequences peptidiques SEQ ID N"* I a 29. II peut notamment s'agir d'anticorps 
transmembranaire natif, ou de fragment ou derive d'un tel anticorps, pour autant que 
ledit anticorps, fragment ou derive d'anticorps soit exprime a la surface de la cellule 
cible du mammifere genetiquement modifiee et soit capable de se fixer a un polypeptide 

20 present a la surface d'une cellule effectrice cytotoxique ou d'un lymphocyte T 
« helper » implique dans le precede d'activation d'une telle cellule, 

(iii) soit au moins pour une molecule inhibitrice d'au moins une proteine ou 
de ses fragments, ladite proteine etant choisie parmi les proteines identifiees (SEQ ID N° 
2, 4, 8, 9, 17, 24) et les sequences peptidiques ou les fragments desdites sequences 

25 appartenant a une meme famille de proteines choisies parmi le perlecan, le precurseur de 
la proteine plasmatique de liaison au retinol, du precurseur de Tactivateur du ganglioside 
GM2, de la calgranuline B et de la saposine B (par exemple SEQ ID N°l, SEQ ID N° 3. 
SEQ ID N° 5 a 7, SEQ ID N° 10 a 16, SEQ ID N° 18 a 23, SEQ ID N*» 25 a 29) et les 
sequences peptidiques qui presentent au moins 70 % d'identite de preference au moins 

30 80 % d'identite et avantageusement au moins 98 d'identite avec I'une quelconque des 
sequences peptidiques SEQ ID N** 1 a 29; les proteines inhibitrices de la fonction et/ou 
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du metabolisme et/ou de la fixation des proteines SEQ ID 2, 4, 8, 9, 1 7, 24 et les 
sequences peptidiques ou les fragments desdites sequences appartenant a une meme 
famille de proteines choisies parmi le perlecan, le precurseur de la proteine plasmatique 
de liaison au retinol, du precurseur de I'activateur du ganglioside GM2, de la 
calgranuline B et de la saposine B (par exemple SEQ ID N°l, SEQ ID N° 3, SEQ ID N° 
5 a 7, SEQ ID NMO a 16, SEQ ID NM8 a 23, SEQ ID N° 25 a 29) et les sequences 
peptidiques qui presentent au moins 70 % d*identite de preference au moins 80 % 
d'identite et avantageusement au moins 98 d*identite avec Tune quelconque des 
sequences peptidiques SEQ ID N° 1 a 29, 

(iv) soit au moins pour un ligand ou toute partie d'un iigand capable de se 
fixer a au moins une proteine ou un fragment de proteine choisi parn?.i les proteines 
identifiees (SEQ ID 2. 4. 8, 9,17, 24) et les sequences peptidiques ou les fragments 
desdites sequences appartenant a une meme famille de proteines choisies parmi le 
perlecan, le precurseur de la proteine plasmatique de liaison au retinol, du precurseur de 
i'activateur du ganglioside GM2, de la calgranuline B et de la saposine B (par exemple 
SEQ ID N^l. SEQ ID N« 3, SEQ ID N° 5 a 7, SEQ ID NMO a 16. SEQ ID N° 18 a 23. 
SEQ ID N° 25 a 29) et les sequences peptidiques qui presentent au moins 70 % 
d*identite de preference au moins 80 % d'identite et avantageusement au moins 98 
dMdentite avec i'une quelconque des sequences peptidiques SEQ ID N° I a 29, et/ou 
d'inhiber sa fonction. 

Plus particulierement, par fragment d'anticorps, on entend les fragments 
F(ab)2, Fab\ Fab, sFv (Blazar et al., 1997, Journal of lmmuno)ogy 159 : 5821-5833 ; 
Bird et a!., 1988 Science 242 : 423-426) d'un anticorps natif et par derive on entend, par 
exemple, un derive chimerique d'un tel anticorps (voir par exemple les chimeres des 
anticorps antiCD3 Souris/Homme dans Arakawa et al., 1996 J Biochem 120 : 657-662 
ou les immunotoxines telles que sFv-toxine de Chaudary et al 1989, Nature 339 : 394- 
397). Par anticorps transmembranaire on entend un anticorps dont au moins la region 
fonctionnelle capable de reconnaitre et de se fixer a son antigene specifique est exprimee 
a la surface des cellules cibles pour permettre lesdites reconnaissance et fixation. Plus 
particulierement, les anticorps selon la presente invention consistent en des polypeptides 
de fusion comprenant les amino acides defmissant ladite region fonctionnelle et une 
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sequence d'amino acides (polypeptide transmembranaire) permettant Tancrage au sein 
de la double couche Hpidique membranaire de la ceilule cible ou a la surface externe de 
cette bi-couche, Les sequences nucleiques codant pour de nombreux polypeptides 
transmembranaires sent decrites dans la litterature. Selon un cas tout a fait avantageux, 
5 la sequence d'acide nucleique codant pour la chame lourde de Tanticorps est fusionnee 
avec la sequence d'acide nucleique codant pour undit polypeptide transmembranaire. 

Par elements assurant P expression dudit gene /// v/vo on fait notamment 
reference aux elements necessaires pour assurer I'expression dudit gene apres son 
transfert dans une cellule cible. II s*agit notamment des sequences promotrices et/ou des 

10 sequences de regulation efficaces dans ladite cellule, el eventuellemeni ies sequences 
requises pour permettre I'expression a la surface des cellules cibles dudit polypeptide. Le 
promoteur utilise peut etre un promoteur viral, ubiquitaire ou specifique de tissu ou 
encore un promoteur synthetique. A titre d'exemple, on mentionnera les promoteurs tels 
que les promoteurs des virus RSV (Rous Sarcoma Virus), MPSV, SV40 (Simian Virus), 

15 CMV (Cytomegalovirus) ou du virus de la vaccine, les promoteurs du gene codant pour 
la creatine kinase muscuiaire, pous I'actine. II est en outre possible de choisir une 
sequence promotrice specifique d'un type ceilulaire donne, ou activable dans des 
conditions defmies. La litterature procure un grand nombre dMnformations relatives a de 
telles sequences promotrices. 

20 Par ailleurs, ledit acide nucleique peut comprendre au moins deux 

sequences, identiques ou diff^rentes, presentant une activite de promoteur 
transcriptionnel et/ou au moins deux genes, identiques ou differents, situes Tun par 
rapport a Tautre de maniere contigue, eloignee, dans le meme sens ou dans le sens 
inverse, pour autant que !a fonction de promoteur transcriptionnel ou la transcription 

25 desdtts genes ne soit pas affectee. 

De meme dans ce type de construction d*acide nucleique, il est possible 
dMntroduire des sequences nucleiques « neutres » ou introns qui ne nuisent pas a la 
transcription et sont epissees avant I'etape de traduction. De telles sequences et leurs 
utilisations sont decrites dans la litterature (reference : demande de brevet PCT WO 

30 94/29471). 
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Ledit acide nucleique peut egalement comprendre des sequences requises 
pour le transport intracellulaire, pour la replication et/ou pour Tintegration, pour la 
transcription et/ou la traduction. De telles sequences sont bien connues de Thomme de 
Fart. 

Par ailleurs, les acides nucleiques utilisables selon la presente invention 
peuvent egalement etre des acides nucleiques modifies de sorte qu*il ne leur est pas 
possible de s'integrer dans le genome de la cellule cible ou des acides nucleiques 
stabilises a I'aide d'agents, tels que par exemple la spermine, qui en tant que tels n'ont 
pas d'effet sur refficacite de la transfection. 

Selon un mode de realisation de Tinvention, la sequence d'acide nucleique 
est une sequence d'ADN ou ARN nue, c'est a dire libre de tout compose facilitant son 
introduction dans les cellules (transfert de sequence d'acide nucleique). Toutefois, selon 
un second mode de realisation de Pinvention, afin de favoriser son introduction dans les 
cellules cibles et afin d'obtenir les cellules genetiquement modifiees de Tinvention, cette 
sequence d*acide nucleique peut etre sous la forme d'un « vecteur », et plus 
particulierement sous la forme d'un vecteur viral, tel que par exemple un vecteur 
adenoviral, retroviral, un vecteur derive d*un poxvirus, notamment derive du virus de la 
vaccine ou du Modified Virus Ankara (MVA) ou d'un vecteur non viral tel que, par 
exemple, un vecteur consistant en au moins une dite sequence d'acide nucleique 
complexee ou conjuguee a au moins une molecule ou substance porteuse selectionnee 
parmi le groupe consistant en un amphiphile cationique, notamment un lipide cationique, 
un polymere cationique ou neutre, un compose polaire pratique notamment choisi parmi 
le propylene glycol, le polyethylene glycol, le glycerol, Tethanol, la 1 -methyl L-2- 
pyrrolidone ou leurs derives, et un compose polaire aprotique notamment choisi parmi le 
dimethylsulfoxide (DMSO), le diethyisulfoxide, le di-n-propylsulfoxide, le 
dimethylsulfone, le sulfolane, la dimethylformamide, le dimethylacetamide. la 
tetramethyluree, Tacetonitrile ou leurs derives. La litterature procure un nombre 
important d'exemples de tels vecteurs viraux et non viraux. 

De tels vecteurs peuvent en outre et de preference comprendre des 
Elements de ciblage pouvant permettre de diriger le transfert de sequence d'acide 
nucleique vers certains types cellulaires ou certains tissus particuliers tels que les cellules 
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cytotoxiques et les cellules presentatrices de I'antigene). lis peuvent egalement 
permettre de diriger le transfert d'une substance active vers certains compartiments 
intracellulaires preferes tel que le noyau, les mitochondries ou les peroxysomes, par 
exemple, II peut en outre s'agir d'elements facilitant la penetration a Tinterieur de la 

5 cellule ou la lyse de compartiments intracellulaires. De tels elements de ciblage sont 
largement decrits dans la litterature. II peut par exemple s'agir de tout ou partie de 
lectines, de peptides, notamment le peptide JTS-1 (voir demande de brevet PCX WO 
94/40958), d'oligonucleotides, de lipides, d'hormones, de vitamines. d'antigenes, 
d'anticorps, de ligands specifiques de recepteurs membranaires, de ligands susceptibles 

10 de reagir avec un anti-ligand. de peptides flisogenes, de peptides de localisation 
nucleaire, ou d'une composition de tels composes. 

Utilisation de cellules transformees in vivo apres injection de vecteurs 
contenant au moins un gene d'interet therapeutique defini a partir des proteines d'interet 
identifiees dans la presente invention (SEQ ID N** 2, 4, 8, 9. 17, 24) et les sequences 

15 peptidiques ou les fragments desdites sequences appartenant a une meme famille de 
proteines choisies parmi le perlecan, le precurseur de la proteine plasmatique de liaison 
au retinol, du precurseur de I'activateur du ganglioside GM2, de la calgranuline B et de 
la saposine B (par exemple SEQ ID N°l, SEQ ID 3, SEQ ID 5 a 7. SEQ ID N° 
10 a 16, SEQ ID N*' 18 a 23, SEQ ID 25 a 29) et les sequences peptidiques qui 

20 presentent au moins 70 % d'identite de preference au moins 80 % d'identite et 
avantageusement au moins 98 d'identite avec Tune quelconque des sequences 
peptidiques SEQ ID N° 1 a 29. 

La presente invention concerne un materiel biologique pour la preparation 
de compositions pharmaceutiques destinee a la prevention et au traitement de 

25 mammiferes atteint de maladies degenerative et/ou neurologique et/ou auto-immune, de 
preference la sclerose en plaques, la composition comprenant au moins un vecteur 
contenant un gene therapeutique comme decrit ci-dessous. capable d'etre introduit dans 
une cellule cible in vivo et d'exprimer le gene d'interet therapeutique in vivo. L*avantage 
de cette invention repose sur la possibilite de maintenir sur le long terme un niveau basal 

30 de molecules exprimees dans le patient traite. Des vecteurs ou acides nucleiques codant 
pour des genes d'interet therapeutique sont injectes. Ces vecteurs et acides nucleiques 
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doivent etre transportes jusqu'aux cellules cibles et transfecter ces cellules dans 

lesquelles ils doivent etre exprimes in vivo. 

L'invention concerne Texpression in vivo de sequences nucleotidiques 

et/ou de vecteurs tels que designes dans le paragraphe precedent, c'est-a-dire des 

sequences correspondant a des genes d'interet therapeutique codant notamment : 

(i) soit au moins pour une proteine choisie parmi les proteines identifiees 
dans la presente invention (SEQ ID N° 2, 4, 8, 9, 17, 24) et les sequences peptidiques 
ou les fragments desdites sequences appartenant a une meme famille de proteines 
choisies parmi le perlecan, le precurseur de la proteine plasmatique de liaison au 
retinol, du precurseur de I'activateur du ganglioside GM2, de la calgranuline B et de 
la saposine B (par exemple SEQ ID N*'!, SEQ ID N** 3, SEQ ID N° 5 a 7, SEQ ID 
N** 10 a 16, SEQ ID N° 18 a 23, SEQ ID N** 25 a 29) et les sequences peptidiques 
qui presentent au moins 70 % d'identite de preference au moins 80 % d'identite et 
avantageusement au moins 98 d'identite avec Tune quelconque des sequences 
peptidiques SEQ ID N° 1 a 29, ou leur(s) fragment(s), 

(i) soit au moins pour tout ou partie d'un anticorps polyclonal ou 
monoclonal capable de se fixer a au moins une proteine choisie parmi les proteines 
identifiees dans la presente invention (SEQ ID N° 2, 4, 8. 9, 17, 24) et les sequences 
peptidiques ou les fragments desdites sequences appartenant a une meme famille de 
proteines choisies parmi le perlecan, le precurseur de la proteine plasmatique de 
liaison au retinol, du precurseur de I'activateur du ganglioside GM2, de la 
calgranuline B et de la saposine B (par exemple SEQ ID N°l, SEQ ID N** 3, SEQ ID 
N° 5 a 7, SEQ ID N° 10 a 16, SEQ ID N° 18 a 23, SEQ ID N° 25 a 29) et les 
sequences peptidiques qui presentent au moins 70 % d'identite de preference au 
moins 80 % d'identite et avantageusement au moins 98 d'identite avec I'une 
quelconque des sequences peptidiques SEQ ID N° 1 a 29. II peut s'agir d'anticorps 
transmembranaire natif, ou de fragment ou derive d'un tel anticorps, pour autant que 
ledit anticorps, fragment ou derive d'anticorps soit exprime a la surface de la cellule 
cible de mammifere genetiquement modifiee et en ce que ledit anticorps est capable 
de se fixer a un polypeptide present a la surface d'une cellule effect rice cytotoxique 
ou d'un lymphocyte T « helper » et implique dans le precede d 'activation d*une telle 
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cellule. II peut s'agir de fragments d*anticorps exprimes par des cellules capables de 
secret er lesdits anticorps dans la circulation sanguine d mammifere ou patient porteur 
des cellules genetiquement modifiees par le gene codant pour Tanticorps, 

(ii) soit au moins pour une molecule inhibitrice d'au moins une proteine 
5 choisie parmi les proteines identifiees (SEQ ID N° 2, 4, 8, 9, 1 7, 24) et les sequences 

peptidiques ou les fragments desdites sequences appartenant a une meme famille de 
proteines choisies parmi le perlecan, le precurseur de la proteine plasmatique de 
liaison au retinol, du precurseur de Tactivateur du ganglioside GM2, de la 
calgranuline B et de la saposine B (par exemple SEQ ID N°l. SEQ ID N** 3, SEQ ID 

10 N° 5 a 7, SEQ ID N° 10 a 16, SEQ ID N° 18 a 23, SEQ ID N° 25 a 29) et les 
sequences peptidiques qui presentent au moins 70 % d'identite de preference au 
moins 80 % d'identite et avantageusement au moins 98 dMdentite avec Tune 
quelconque des sequences peptidiques SEQ ID N** 1 a 29; proteine inhibitrice de la 
fonction et/ou du metabolisme et/ou de la fixation des proteines SEQ ID N° 2, 4, 8,9, 

15 17, 24 et les sequences peptidiques ou les fragments desdites sequences appartenant a 

une meme famille de proteines choisies parmi le perlecan, le precurseur de la proteine 
plasmatique de liaison au retinol, du precurseur de Tactivateur du ganglioside GM2, 
de la calgranuline B et de la saposine B (par exemple SEQ ID N°l, SEQ ID N° 3. 
SEQ ID N° 5 a 7. SEQ ID N° 10 a 16, SEQ ID 18 a 23, SEQ ID N° 25 a 29) et 

20 les sequences peptidiques qui presentent au moins 70 % d'identite de preference au 
moins 80 % d'identite et avantageusement au moins 98 dMdentite avec Tune 
quelconque des sequences peptidiques SEQ ID N** 1 a 29, 

(iii) soit au moins pour un ligand ou toute partie du ligand capable de se 
fixer sur au moins une proteine choisie parmi les proteines identifiees (SEQ ID N° 2, 

25 4, 8, 9, 17, 24) et les sequences peptidiques ou les fragments desdites sequences 
appartenant k une meme famille de proteines choisies parmi le perlecan, le precurseur 
de la proteine plasmatique de liaison au retinol, du precurseur de Tactivateur du 
ganglioside GM2, de la calgranuline B et de la saposine B (par exemple SEQ ID N**l, 
SEQ ID N° 3. SEQ ID 5 a 7, SEQ ID NMO a 16, SEQ ID 18 a 23. SEQ ID 

30 25 a 29) et les sequences peptidiques qui presentent au moins 70 % d'identite de 

preference au moins 80 % dMdentite et avantageusement au moins 98 dMdentite avec 
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Tune quelconque des sequences peptidiques SEQ ID N° 1 a 29. et/ou d'inhiber sa 
fonction. 

Selon un mode de realisation particulier, il s'agit d'utiliser la therapie 
genique de maniere a diriger la reponse immune centre la proteine, le peptide ou la 
5 molecule d'interet cible, c*est-a-dire centre toute proteine choisie parmi les proteines 
SEQ ID N° 2, 4, 8, 9, 17, 24 et les sequences peptidiques ou les fragments desdites 
sequences appartenant a une meme famille de proteines choisies parmi le perlecan, le 
precurseur de la proteine plasmatique de liaison au retinol, du precurseur de Tactivateur 
du ganglioside GM2, de la calgranuiine B et de la saposine B (par exemple SEQ ID N*'!, 

10 SEQ ID N** 3, SEQ ID N** 5 a 7, SEQ ID N° 10 a 16, SEQ ID N** 18 a 23, SEQ ID N° 
25 a 29) et les sequences peptidiques qui presentent au moins 70 % d'identite de 
preference au moins 80 % d'identite et avantageusement au moins 98 d'identite avec 
Tune quelconque des sequences peptidiques SEQ ID N° 1 a 29, leur(s) fragment(s) 
et/ou contre toute molecule inhibitrice de la fonction et/ou de Texpression et/ou du 

15 metabolisme desdites proteines d'interet, et/ou des ligands desdites proteines comme par 
exemple les recepteurs. Pour cela il est evident que les cellules a cibler pour la 
tansformation avec un vecteur sont des cellules appartenant au systeme immun, soit des 
cellules de type lymphocytes (CD4/CD8), soit des cellules presentatrices de Tantigene 
(cellules dendritiques, macrophages, ...). 

20 Selon un mode de realisation particulier, on modifte genetiquement, 

notamment /// vivo, les cellules presentatrices de Tantigene (CPA). Les CPA comme les 
macrophages, les cellules dendritiques, les microgliocytes, les astrocytes jouent un role 
dans I'initiation de la reponse immune. Elles sont les premiers composants cellulaires qui 
capturent Tantigene, Tapprete dans la cellule et expriment des molecules du CMHI et 

25 CMHII transmembranaires impliquees dans la presentation de I'immunogene aux cellules 
T CD4+ et CD8+, elles produisent des proteines accessoires specifiques qui participent 
a Tactivation des cellules T (Debrick et al 1991, J. Immunol 147 : 2846 ; Reis et al, 
1993, J Ep Med 178 : 509; Kovacsovics-bankowski et al., 1993, PNAS 90 : 4942; 
Kovacsovics-bankowski et al., 1995 Science 267: 243; Svensson et al., 1997, J 

30 Immunol 158: 4229; Norbury et al 1997, Eur J Immunol 27: 280). Pour une 
vaccination, il peut etre avantageux de disposer d*un systeme de therapie genique qui 
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peut cibler le transfert de gene dans de telles cellules APC, c'est -a-dire un gene qui 
code pour un polypeptide qui peut, apres sa production intracellulaire et on processing, 
etre presente aux cellules CD8+ et/ou CD4+ par les molecules des complexes CMHI et 
CMHII respect ivement a la surface de ces cellules. 
5 On choisit d'exprimer a la surface des cellules CPA in vivo tout ou partie 

d'un anticorps et/ou d'un ligand comme par exemple un recepteur, capable de reagir 
avec la proteine ou le peptide cible choisis parmi les proteines SEQ ID N° 2, 4, 8, 9, 17, 
24 et les sequences peptidiques ou les fragments desdites sequences appartenant a une 
meme famille de proteines choisies parmi le perlecan, le precurseur de la proteine 

10 plasmatique de liaison au retinol, du precurseur de Pactivateur du ganglioside GM2, de 
la calgranuline B et de la saposine B (par exemple SEQ ID N°l, SEQ ID N° 3, SEQ ID 
N° 5 a 7, SEQ ID N'^ 10 a 16, SEQ ID N° 18 a 23, SEQ ID N° 25 a 29) et les sequences 
peptidiques qui presentent au moins 70 % d'identite de preference au moins 80 % 
d'identite et avantageusement au moins 98 d'identite avec Tune quelconque des 

15 sequences peptidiques SEQ ID 1 a 29. De telles cellules vont alors specifiquement 
phagocyter ladite proteine ou ledit peptide, le « processer » de fapon a ce que des 
fragments de ce peptide soient presentes a la surface des cellules presentatrices de 
Tantigene. 

La litterature propose un grand nombre d'exemples de genes codant pour 
20 des anticorps capables de reagir avec des polypeptides ou recepteurs. II est a la protee 
de rhomme de Tart d'obtenir les sequences d'acides nucleiques codant pour de tels 
anticorps. Citons par exemple les genes codant pour les chaines legere et lourde de 
Tanticorps YTH 12.5 (anti-CD3) (Routledge et al. 1991, Eur J Immunol 21 : 2717- 
2725), de ranti-CD3 selon Arakaw^a et al ; 1996, J. Biochem. 120: 657-662. Les 
25 sequences d*acide nucleique de tels anticorps sont aisement identifiables a partir des 
bases de donnees communement utilisees par Thomme du metier. II est egalement 
possible a partir d'hybridomes disponibles aupres de I'ATCC de doner les sequences 
d'acides nucleiques codant pour les chaines lourdes et/ou legeres de ces differents 
anticorps par les methodes d 'amplification telles que la RT-PCR a Taide 
30 d*oligonucleotides specifiques ou les techniques mettant en oeuvre des banques de 
cDNA (Maniatis et al ., 1982, Molecular cloning. A laboratory manual CSH Laboratory, 
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Cold Spring Harbor, New York). Les sequences ainsi donees sont alors disponibies 
pour leur clonage dans des vecteurs. Selon un cas prefere de I'invention, la sequence 
d*acide nucleique codant pour la chaine lourde de Tanticorps est fusionnee par 
recombinaison homologue avec la sequence d'acide nucleique codant pour un 
5 polypeptide transmembranaire tel que la glycoproteine rabique ou la gpl60 (Polydefkis 
et al., 1990J Exp Med 171 : 875-887). Ces techniques de biologie moleculaire ont ete 
parfaitement bien decrites. 

On choisit d*exprimer a la surface des cellules CPA in vivo des fragments 
immunogenes correspondant a au moins une proteines choisie parmi les proteines SEQ 

10 ID N° 2, 4, 8, 9, 17, 24 et les sequences peptidiques ou les fragments desdites sequences 
appartenant a une meme famille de proteines choisies parmi le perlecan, le precurseur de 
la proteine plasmatique de liaison au retinol, du precurseur de I'activateur du ganglioside 
GM2, de la calgranuline B et de la saposine B (par exemple SEQ ID N°l. SEQ ID N*^ 3. 
SEQ ID N° 5 a 7, SEQ ID 10 a 16, SEQ ID N° 18 a 23, SEQ ID N** 25 a 29) et les 

15 sequences peptidiques qui presentent au moins 70 % d'identite de preference au moins 
80 % d'identite et avantageusement au moins 98 d'identite avec Tune quelconque des 
sequences peptidiques SEQ ID N** 1 a 29. Pour cela, on peut choisir de faire exprimer 
par le vecteur soit le polypeptide complet soit de maniere prefere des polypeptides 
selectionnes pour reagir avec des ligands et/ou recepteurs specifiques. Le peptide 

20 immunogene code par le polynucleotide introduit dans la cellule du vertebre /// vivo peut 
etre produit et/ou secrete, apprete puis presente a une cellule presentatrice de I'antigene 
(APC) dans le contexte des molecules du CMH. Les APC ainsi transferees in vivo 
induisent une reponse immune dirigee centre l"immunogene exprime /// vivo, Les APC 
possedent differents mecanismes pour capturer les antigenes : (a) la capture des 

25 antigenes par des recepteurs membranaires comme les recepteurs aux immunoglobulines 
(Fc) ou pour le complement disponibies a la surface des granulocytes, des monocytes ou 
macrophages permettant une delivrance efficace de I'antigene dans les compartiments 
intracellulaires apres phagocytose mediee par les recepteurs. (b) I'entree dans les APC 
par pinocytose en phase fluide, impliquant differents mecanismes : la micropinocytose 

30 c'est-a-dire la capture de petites vesicules (0.1 pm) par les puits recouverts de clathrine 
et la macropinocytose c'est-a-dire la capture de plus grosses vesicules (avec une taille 
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variant ente 0.5 ^m et environ 6 \im) (Sallusto et al. 1995, J Exp Med 182 : 389-400). 
Tandis que la micropinocytose existe de fapon constitutive dans toutes les cellules, la 
macropinocytose est limitee a des types cellulaires, comme par exemple les 
macrophages, les cellules dendritiques, les astrocytes, ies cellules epitheliales stimulees 
par des facteurs de croissance (Racoosin et al., J Cell Sci 1992, 102 : 867-880). Dans 
cette invention, on entend par cellules capables de macropinocytose, les cellules qui 
peuvent realiser les evenements decrits ci-dessus et les cellules qui peuvent capturer des 
macromolecules de preference entre 0.5 \im et environ 6 jim dans le cytoplasme. 

Selon un mode de realisation particulier, on modifie genetiquement 
notamment in vivo, les cellules effectrices cytotoxiques ou les lymphocytes T « helper » 
de fagon a ce qu'elles expriment a leur surface un polypeptide correspondant aux 
proteines SEQ ID N° 2, 4. 8. 9, 17, 24 et les sequences peptidiques ou les fragments 
desdites sequences appartenant a une meme famille de proteines choisies parmi le 
perlecan, le precurseur de la proteine plasmatique de liaison au retinol, du precurseur de 
Tactivateur du ganglioside GM2, de la calgranuline B et de la saposine B (par exemple 
SEQ ID N°l, SEQ ID N'' 3, SEQ ID N° 5 a 7, SEQ ID N° 10 a 16, SEQ ID N° 18 a 23, 
SEQ ID N° 25 a 29) et les sequences peptidiques qui presentent au moins 70 % 
d'identite de preference au moins 80 % d'identite et avantageusement au moins 98 
dMdentite avec Tune quelconque des sequences peptidiques SEQ ID N° I a 29, a des 
ligands desdites proteines, naturellement non exprimes par ces cellules, et capables 
d'induire le procede deactivation de telles cellules, par Tintroduction dans ces cellules de 
sequences d'acide nucleique renfermant le gene codant pour un tel polypeptide. 
Conformement a la presente invention, ii est egalement possible de selectionner une 
sequence d'acide nucleique contenant un gene d'interet therapeutique codant pour tout 
ou partie d'un anticorps dirige contre une proteine choisie parmi les proteines SEQ ID 
2, 4, 8, 9. 17, 24 et les sequences peptidiques ou les fragments desdites sequences 
appartenant a une meme famille de proteines choisies parmi le perlecan, le precurseur de 
la proteine plasmatique de liaison au retinol, du precurseur de Tactivateur du ganglioside 
GM2, de la calgranuline B et de la saposine B (par exemple SEQ ID N*"], SEQ ID N** 3, 
SEQ ID N° 5 a 7, SEQ ID N° 10 a 16, SEQ ID N° 18 a 23, SEQ ID N*' 25 a 29) et les 
sequences peptidiques qui presentent au moins 70 % d'identite de preference au moins 
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80 % d'identite et avantageusement au moins 98 dMdentite avec Tune quelconque des 
sequences peptidiques SEQ ID N° 1 a 29, susceptible d'etre exprime a la surface des 
cellules cibles du patient a traiter, ledit anticorps etant capable de se fixer a un 
polypeptide natureliement non exprime par ces cellules effectrices cytotoxiques ou 
lymphocytes T « helper ». 

Par cellules effectrices cytotoxiques, on entend designer les macrophages, 
les astrocytes, les lymphocytes T cytotoxiques (TCL) et les cellules tueuses (NK) ainsi 
que leurs derives telles que par exemple les LAK (Versteeg 1992 Immunology today 
13 : 244-247 ;Brittende et al 1996, Cancer 77 :1226-1243). Par 'lymphocytes T helper' 
on entend designer notamment les CD4 qui permettent apres activation la secretion de 
facteurs d'activation des cellules effectrices de la 

notamment les recepteurs exprimes a la surface de ces cellules et qui sont impliques dans 
Tactivation de telles cellules consistent notamment en tout ou partie du complexe TCR 
ou le CD3, tout ou partie des complexes CDS, CD4, CD28, LFA-1, 4- IBB (Melero et 
al, 1998. Eur J Immunol 28: 1116-1121), CD47, CD2, CDl, CD9, CD45, CD30. 
CD40, tout ou partie des recepteurs de cutokines (Finke etal., 1998, Gene therapy 5 : 
31-39), telles que IL-7. IL-4, IL-2, IL-15 ou GM-CSF, tout ou partie du complexe 
recepteur des cellules NK tel que par exemple NKAR, Nkp46, ; (Kawano et al., 1998 
Immunology 95 :5690-5693 ; Pessino et a!., 1998 J Exp Med 188 :953-960), Nkp44, 
tout ou partie des recepteurs de macrophages tels que par exemple le recepteur Fc (Deo 
et al., 1997, Immunology Today 18 : 127-135). 

De nombreux outils ont ete developpes pour introduire differents genes 
heterologues et/ou vecteurs dans des cellules, en particulier des cellules de mammiferes. 
Ces techniques peuvent etre divisees en deux categories : la premiere categoric implique 
des technique physiques comme la micro-injection, Telectroporation ou le 
bombardement de particules. La seconde categorie est basee sur Tutilisation de 
techniques en biologie moleculaire et cellulaire avec lesquelles le gene est transfere avec 
un vecteur biologique ou synthetique qui facilite Tintroduction du materiel dans la 
cellule in vivo. Aujourd'hui, les vecteurs les plus efficaces sont les vecteurs viraux en 
particulier les adenoviraux et retroviraux. Ces virus possedent des proprietes naturelles 
pour traverser les membranes plasmiques, eviter la degradation de leur materiel 
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genetique et introduire leur genome dans le noyau de la cellule. Ces virus ont ete 
largement etudies et certains sont deja utilises experimentalement dans des applications 
humaines en vaccination, en immunotherapie, ou pour compenser des deficiences 
genetiques. Cependant cette approche virale a des limitations notamment due a la 

5 capacite de clonage restreinte dans ces genomes viraux, le risque de disseminer les 
particules virales produites dans Torganisme et Tenvironnement, le risque de 
mutag6nese artefactuelle par insertion dans la cellule bote dans le cas des retrovirus, et 
la possibilite d'induire une forte reponse immune inflammatoire in vivo pendant le 
traitement, ce qui limite le nombre d'injections possibles (Mc Coy et al. 1 1995, human 

10 Gene Therapy 6: 1553-1560; Yang et al., 1996 Immunity 1 : 433-422). D'autres 
systemes alternatifs a ces vecteurs viraux existent. L'utilisation de methodes non virales 
comme par exemple la co-precipitation avec le phosphate de calcium, rutilisation de 
recepteurs qui miment les systemes viraux (pour un resume voir Gotten et Wagner 1993, 
Current Opinion in Biotehcnology, 4 ; 705-710), ou 1' utilisation de polymeres comme 

15 les polyamidoamines (haensier et Szoka 1993, Bioconjugate Chem 4 : 372-379). 
D'autres techniques non virales sont basees sur Tutilisation de liposomes dont 
refficacite pour Tintroduction de macromolecules biologiques comme TADN, TARN 
des proteines ou des substances pharmacteutiques actives a ete largement decrite dans la 
litterature scientifique. Dans ce domaine des equipes ont propose Tutilisation de lipides 

20 cationiques ayant une forte affmite pour les membranes cellulaires et/ou les acides 
nucleiques. En fait il a ete montre qu'une molecule d'acide nucleique elle-meme pouvait 
traverser la membrane plasmique de certalnes cellules in v/vo (WO 90/1 1092), 
TefFicacite etant dependante en particulier de la nature polyanionique de Tacide 
nucleique. Des 1989 (Feigner et al ;, Nature 337 : 387-388) les lipides cationiques ont 

25 ete proposes pour faciliter 1' introduction de larges molecules anioniques, ce qui 
neutralise les charges negatives de ces molecules et favorise leur introduction dans les 
cellules. Differentes equipes ont developpes de tels lipides cationiques : le DOTMA 
(Feigner et al, 1987, PNAS 84 : 7413-7417), leDOGS ou Transfectam*^ (Behr et al., 
1989, PNAS 86 : 6982-6986), le DMRIE et le DORIE (Feigner et al, 1993 methods 5 : 

30 67-75), le DC-CHOL (Gao et Huang 1991, BBRC 179: 280-285), le DOTAP™ 
(McLachlan et al, 1995, Gene therapy 2 : 674-622) ou la Lipofeciamine'^'^, et les autres 
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molecules decrites dans les brevets W09 116024, W095 14651, WO9405624. D'autre 
groupes ont deveioppes des polymeres cationiques qui facilitent le transfert de 
macromolecules en particulier des macromolecules anioniques dans les cellules. Le 
brevet W095/24221 decrit !*utilisation de polymeres dendritiques, le document 
5 WO96/02655 decrit Putilisation du polyethyleneimine ou polypropyleneimine et les 
document US-A-5595897 et FR 27193 16, Tutilisation des conjugues polylysine. 

Etant donne que Ton souhaite obtenir in vivo une transformation ciblee 
vers un type cellulaire donne, il est evident que le vecteur utilise doit pouvoir etre lui- 
meme « cible » comme decrit ci dessus). 

10 Utilisation de cellules transformees in vitro ou ex vivo avec des vecteurs 

contenant un gene d'interet therapeutique defini par rapport aux proteines dMnteret 
identifiees dans la presente invention (SEQ ID N° 2, 4, 8, 9, 17, 24) et les sequences 
peptidiques ou les fragments desdites sequences appartenant a une meme famille de 
proteines choisies parmi le perlecan. le precurseur de la proteine plasmatique de liaison 

15 au retinol, du precurseur de Tactivateur du ganglioside GM2, de la calgranuline B et de 
la saposine B (par exemple SEQ ID N°l, SEQ ID N° 3, SEQ ID N° 5 a 7, SEQ ID N° 
10 a 16. SEQ ID N*» 18 a 23, SEQ ID N° 25 a 29) et les sequences peptidiques qui 
presentent au moins 70 % d'identite de preference au moins 80 % d'identite et 
avantageusement au moins 98 d'identite avec Tune quelconque des sequences 

20 peptidiques SEQ ID N° 1 a 29. 

La presente invention concerne un materiel biologique pour la preparation 
de compositions pharmaceutiques destinee a la prevention et au traitement de maladies 
degenerative et/ou neurologique et/ou auto-immune, de preference la sclerose en 
plaques, la composition comprenant au moins une cellule, notamment une cellule ne 

25 produisant pas naturellement des anticorps, sous une forme permettant leur 
administration dans Torganisme d'un mammifere, humain ou animal, ainsi 
qu'eventuellement leur culture prealable, ladite cellule etant genetiquement modifiee in 
vitro par au moins une sequence d'acide nucleique contenant au moins un gene codant 
in vivo pour 

30 (i) au moins une proteine choisie parmi les proteines SEQ ID 2, 4, 8, 

9, 17, 24, et les sequences peptidiques ou les fragments desdites sequences 
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appartenant a une meme famille de proteines choisies parmi le perlecan, le precurseur 
de la proteine plasmatique de liaison au retinol, du precurseur de Tactivateur du 
ganglioside GM2, de la calgranuline B et de la saposine B (par exemple SEQ ID N°l, 
SEQ ID N° 3, SEQ ID N° 5 a 7. SEQ ID N° 10 a 16, SEQ ID N° 18 a 23. SEQ ID 
5 N° 25 a 29) et les sequences peptidiques qui presentent au moins 70 % d'identite de 
preference au moins 80 % dMdentite et avantageusement au moins 98 d'identite avec 
I'une quelconque des sequences peptidiques SEQ ID N° 1 a 29 et les sequences 
peptidiques qui presentent au moins 70 % dMdentite de preference au moins 80 % 
d*identite et avantageusement au moins 98 d*identite avec Tune quelconque des 
10 sequences peptidiques SEQ ID N° 1 a 29, et tout fragment 

(ii) au moins un peptide defmi a partir de la sequence primaire d'au 
moins une proteine choisie parmi les proteines SEQ ID 2, 4, 8, 9, 1 7, 24, et les 
sequences peptidiques ou les fragments desdites sequences appartenant a une meme 
famille de proteines choisies parmi le perlecan, le precurseur de la proteine 

15 plasmatique de liaison au retinol, du precurseur de Tactivateur du ganglioside GM2, 
de la calgranuline B et de la saposine B (par exemple SEQ ID N°l, SEQ ID N** 3, 
SEQ ID 5 a 7, SEQ ID N° 10 a 16, SEQ ID N° 18 a 23, SEQ ID N° 25 a 29) et 
les sequences peptidiques qui presentent au moins 70 % dMdentite de preference au 
moins 80 % d'identite et avantageusement au moins 98 d'identite avec Tune 

20 quelconque des sequences peptidiques SEQ ID N° 1 a 29, 

(iii) au moins toute molecule inhibitrice de la fonction et/ou de la 
fixation et/ou de i'expression de ces proteines, 

(iv) au moins un peptide issu de la sequence primaire d*une proteine 
choisie parmi les proteines SEQ ID N"* 2, 4, 8, 9, 17, 24, et les sequences peptidiques 

25 ou les fragments desdites sequences appartenant a une meme famille de proteines 
choisies parmi le perlecan, le precurseur de la proteine plasmatique de liaison au 
retinol, du precurseur de Tactivateur du ganglioside GM2, de la calgranuline B et de 
la saposine B (par exemple SEQ ID N^l, SEQ ID N° 3, SEQ ID N° 5 a 7, SEQ ID 
N"" 10 a 16, SEQ ID N° 18 a 23, SEQ ID N° 25 a 29) et les sequences peptidiques 

30 qui presentent au moins 70 % d'identite de preference au moins 80 % dMdentite et 
avantageusement au moins 98 d'identite avec Tune quelconque des sequences 



67 



peptidiques SEQ ID 1 a 29, et capable de se fixer sur au moins une glycoproteine 
du CMHI, 

(v) au moins tout anticorps et toute partie d'anticorps capables de se 
fixer a au moins une proteine choisie parmi les proteines SEQ ID N° 2^ 4, 8, 9, 17, 
5 24, et les sequences peptidiques ou les fragments desdites sequences appartenant a 
une meme famille de proteines choisies parmi le perlecan, le precurseur de la proteine 
plasmatique de liaison au retinol, du precurseur de I'activateur du ganglioside GM2, 
de la calgranuline B et de la saposine B (par exemple SEQ ID N°l, SEQ ID N"* 3, 
SEQ ID N° 5 a 7, SEQ ID N° 10 a 16, SEQ ID N** 18 a 23, SEQ ID N*» 25 a 29) et 
10 les sequences peptidiques qui presentent au moins 70 % d'identite de preference au 
moins 80 % d'identite et avantageusement au moins 98 d'identite avec i'une 
quelconque des sequences peptidiques SEQ ID N° 1 a 29. 

Plus particulierement, ladite cellule cible provient soit du mammifere a 
traiter, soit d'un autre mammifere que celui a traiter. Dans ce dernier cas, il convient de 
15 noter que ladite cellule cible aura subi un traitement la rendant compatible avec le 
mammifere a traiter. Selon un as prefere, par 'mammifere* on entend designer un 
mammifere humain. Ces cellules sont etablies en iignees cellulaires et sont 
preferentiellement CMHII+ ou CMHIl+-inductibles comme les lymphocytes, les 
monocytes, les astrocytes, les oligoddendrocytes. 
20 L' invention concerne egalemeni les cellules modifiees et un precede de 
preparation d'une cellule telle que decrlte ci dessus caracterise en ce que Ton introduit 
dans une cellule de mammifere ne produisant pas naturellement d'anticorps, par tout ou 
moyen approprie, au moins une sequence d'acide nucleique contenant au moins un gene 
d'interet therapeutique et des elements assurant I'expression dudit gene dans ladite 
25 cellule, ledit gene d*interet therapeutique contenant une sequence d'acide nucleique 
codant pour une molecule ou un fragment de molecule in vivo, comme decrit juste ci- 
dessus. Plus particulierement, elle concerne des cellules procaryotes , des cellules de 
levure et des cellules animates, en particulier des cellules de mammiferes tansformees par 
au moins une sequence nucleotidique et/ou un vecteur tel que decrit precedemment. 
30 Selon un mode de realisation particulier, les cellules (cellules dendritiques, 
macrophages, astrocytes, lymphocytes T CD4+, lymphocytes T CD8+, ) du patient 
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ou allogeniques sont placees en contact d*une preparation purifiee du polypeptide cible, 
celui-ci etant internalise, apprete et presente a la surface celluiaire associe aux molecules 
du CMHI et/ou CMHII et ainsi induire une reponse immune specifique contre le 
peptide. Les cellules « activees » sont ensuite administrees au patient chez lequel elles 
5 vent induire une reponse immune specifique des antigenes (on utilise une voie naturelle 
de la reponse immune, mais on controle ce que !a cellule presentatrice de Tantigene va 
presenter) 

Selon un mode de realisation particulier, les cellules presentatrices 
d'antigene (cellule dendritique, macrophage, astrocytes,..) sont modifiees in vitro pour 
10 exprimer les antigenes dans la cellule transformer qui vont s*associer aux molecules du 
CMHI et/ou CMHII et etre presentees a la surface des cellules pour induire chez le 
patient chez lequel on administre la cellule modifiee une reaction immune parfaitement 
ciblee. 

Toutes les approches vaccinales ne sont pas toujours satisfaisantes et 

15 conduisent par exemple a des reactions immunes limitees dirigees uniquement a 
rencontre d'epitopes immunodominants ou contre des antigenes presentant une grande 
variabilite. De meme la presentation incorrecte des antigenes par les glycoproteines du 
systeme CMH a la surface des cellules, ne permet pas de developper chez le patient 
traite une immunite anti-proteine d'interet convenable. Afin de pallier ces problemes, 

20 certains auteurs ont propose dans le cadre de tels procedes vaccinaux, de selectionner 
les fragments minimaux antigeniques correspondant aux portions de peptide susceptibles 
d'etre reconnus specifiquement par les lymphocytes T cytotoxiques, de les exprimer 
dans les cellules afm quMls s*associent aux molecules du CMHI et soient presentes a la 
surface des cellules pour induire chez le patient traite une reaction immunitaire 

25 parfaitement ciblee (Toes et al. 1997, PNAS 94 : 14660-14665). Plus particulierement, il 
a ete montre que des epitopes de tres petites tailles (variant de 7 a environ 13 acides 
amines) qui sont exprimes a partir de minigenes introduits dans un vims de la vaccine, 
pouvaient induire une immunisation de type celluiaire. II a par ailleurs ete montre que 
plusieurs minigenes pouvaient etre exprimes conjointement a partir d*un meme vecteur 

30 (cette construction particuliere est appelee * string of beads'). Une telle construction 
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presente Tavantage d'induire une reaction immune de type CTL synergique (Whitton et 
al 1993 J. of Virology 67 : 348-352). 

Protocole de mise en contact des cellules et du fragment antigenique : 
La presentation des fragments antigeniques par les molecules CMHI repose 
5 sur un precede intracellulaire identifie (voir Groettrup et al., 1996 Immunology Today 
17 : 429-435 pour une revue) au cours duquel des peptides antigeniques de tres courtes 
tallies (environ 7-13 acides amines) sont produits par degradation d'un polypeptide plus 
complexe centre lequel la reaction immune finale sera dirigee. Ces courts peptides sont 
ensuite associes aux molecules du CMHI ou du CMHII pour former un complexe 

10 proteique qui est transporte a la surface cellulaire afin de presenter lesdits peptides aux 
lymphocytes T cytotoxiques circulants ou aux lymphocytes T helper circulants, 
respectivement. II convient en outre de noter que la specificite des molecules CMH I ou 
CMH II vis-a-vis des peptides antigeniques varie en fonction des molecules CMH 1 ou 
CMH II (exemple pour !e CMHI : HLA-A, HLA-B, ...) et de rallele (exemple pour le 

15 CMH 1: HLA-A2, HLA-A3, HLA-All) consideres. Au sein d*une meme espece 
animale, d'un individu a Pautre, ii existe une grande variabilite des genes codant pour les 
molecules du systeme CMH (a ce sujet, voir notamment George et al., 1995, Imunology 
Today 16:209-212). 

Selon un mode de realisation particulier, les cellules, teiles que les cellules 

20 dendritiques, les macrophages, les astrocytes, les lymphocytes T CD4+, les lymphocytes 
T CD8+, sont modifiees de maniere a exprimer a leur surface des anticorps specifiques 
du peptide cible. Le peptide est neutralise par les anticorps exprimes a la surface des 
cellules. Ces cellules sont de preference immunes, de preference du patient, de 
preference cytotoxiques, modifiees pour exprimer tout ou partie d'un anticorps 

25 specifique du polypeptide cible. 

Isolement de cellules mononuclees a partir de sang peripherique : 
En 1968, Boyum decrivit une technique rapide qui permet par 
centrifugation du sang sur gradient de densite, de separer les cellules mononuclees 
(lymphocytes et monocytes) avec un bon rendement (rendement theorique 50%, c'est-a- 

30 dire 10* cellules /ml de sang). 50 ml de sang peripherique preleves sterilement dans des 
tubes heparines sont centrifiiges 20 minutes a I50g a 20**C. Les cellules recuperees sont 
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diluees dans deux volumes de sang peripherique initial de PBS sterile. 10 ml de cette 
suspension sont deposes sur 3 ml d *une solution de ficoll-Hypaque (milieu de separation 
des lymphocytes, Flow). Apres centrifligation pendant 20 minutes a 400g et 20°C sans 
freinage de deceleration , les cellules mononuclees sedimentent a I'interface PBS-Ficoll, 
en une couche dense, opalescente, alors que la quasi-totalite des globules rouges et des 
polynucleaires sedimentent au fond du tube. Les cellules mononuclees sont recuperees et 
lavees en PBS sterile, 

Internalisation des antigenes par les cellules presentatrices de Tantigene : 
Traitement prealable des cellules presentatrices de !*antigene : les cellules 
presentatrices de Tantigene sont prealablement lavees avec un tampon PBS-BSA a 0.5% 
(p/v) puis enumerees puis elle sont preincubees en presence de difFerents inhibiteurs de 
reduction trois fois en PBS-BSA 0.5% contenant de 10 |.iM a 10 mM fmal de DTNB 
(acide 5.5'-dithio-bis-2-nitrobenzoique) ou de NEM (N-ethylmaleimide). Les etapes 
ulterieures de fixation d*antigenes a la surface cellulaire ou d 'internalisation d'antigenes 
se realisent aussi en presence des differentes concentrations dMnhibiteurs. 

Protocole dMnternalisation des antigenes par les cellules presentatrices de 

I'antigene : 

8.10*^ cellules sont internalises en presence de quantite saturante de 
proteines radiomarquees a Tiode 125 (1 ^ig) dans des micropuits dans 70 ^1. Apres une 
heure dMncubation a 4°C sous agitation, les antigenes sont fixes a la surface des cellules. 
La suspension cellulaire est lavee deux fois en PBS-BSA et les culots cellulaires sont 
repris dans 70 |il de tampon et incubees a 37°C pendant differentes periodes allant 
jusqu'a 2 heures. Cellules et surnageants sont separes par centrifligation a 800g pendant 
5 minutes 4*'C. Pour des plus longues periodes d'incubation, I'etape preliminaire de pre- 
fixation des antigenes a la surface des cellules est supprimee, Les cellules sont diluees 
dans un milieu RPMI-10% SVF en presence de 20 mM Hepes, a lO^cellules /ml. Les 
cellules sont incubees en presence d'un exces d'antigene pendant differentes periodes a 
37**C (1 |ig de molecules /5.10'' cellules monocytes/macrophages ou /lO' cellules B- 
EBV). 

Tous les agents therapeutiques definis dans le cadre de la presente 
invention sont utilises pour prevenir et/ou traiter une maladie degenerative et/ou 
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neurologique et/ou auto-immune^ telle que la sclerose en plaques, seuls ou en 
combinaison. lis peuvent etre utilises egalement pour evaluer leur efficacite in vitro ou 
in vivo, . 

Administration chez rhomme des agents therapeutiques designes ci- 

S dessus : 

Le materiel biologique selon T invention peut etre administre in vivo 
notamment sous forme injectable. On peut egalement envisager une injection par voie 
epidermique, intraveineuse, intra-arterielle, intramusculaire, intracerebrale par seringue 
ou tout autre moyen equivalent. Selon un autre mode de realisation par administration 

10 orale ou tout autre moyen parfaitement connu de Thomme de Tart et applicable a la 
presente invention L'administration peut avoir lieu en dose unique ou repetee, une ou 
plusieurs fois apres un certain delai d'intervalle. La voie d*administration et le dosage les 
mieux appropries variant en fonction de differents parametres tels que par exemple 
rindividu ou la maladie a traiter, du stade et/ou de revolution de la maladie, ou encore 

15 de Tacide nucleique et/ou de la proteine et/ou peptide et/ou molecule et/ou cellule a 
transferer ou de Torgane/tissus cible. 

Pour la mise en oeuvre du traitement du mammifere mentionne dans la 
presente invention, il est possible de disposer de compositions pharmaceutiques 
comprenant un materiel biologique tel que precedemment decrit, avantageusement 

20 associe avec un vehicule pharmaceutiquement acceptable pour T administration a 
I'homme ou a Tanimal. L'utilisation de tels supports est decrite dans la litterature (voir 
par exemple Remington's Pharmaceutical Sciences 16"' ed. 1980, Mack Publishing Co). 
Ce vehicule pharmaceutiquement acceptable est preferentiellement isotonique, 
hypotonique ou presente une faible hypertonicite et a une force ionique relativement 

25 basse, tel que par exemple une solution de sucrose. Par ailleurs. ladite composition peut 
contenir des solvants. des vehicules aqueux ou partiellement aqueux tels que de Teau 
sterile, libre d'agents pyrogene et des milieux de dispersion par exemple. Le pH de ces 
compositions pharmaceutiques est convenablement ajuste et tamponne selon les 
techniques conventionnelles. 

30 



Exemple 1 : Recueil et pool d*urines. 
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Des echantillons d'urine de volumes differents ont ete preleves a partir 
d'individus sains (SEP negatifs) n'ayant a priori aucune maladie neurologique ou auto- 
immune. L'activite toxique de chaque prelevement vis a vis de cellules astroc>taires 
murines a ete testee w vitro en utilisant le test MTT. Au total un pool de 20 litres 
5 d'urine a ete constitue (pool SEP negatif). Parallelement, des echantillons d*urine de 
volumes differents ont ete preleves a partir d'individus atteints de sclerose en plaques 
(SEP positifs) a differents stade de la maladie. L'activite toxique de chaque prelevement 
vis a vis de cellules astrocytaires murines a ete testee in vHro en utilisant le test MTT. 
Au total un pool de 80 litres d*urine a ete constitue (pool SEP positiQ. 

10 

Exemple 2 : Purification des proteines urinaires. 

Les pools d'urine SEP positif et SEP negatif, recueillis et testes selon 
Texemple 1, ont ete purifies pour obtenir une concentration en proteines elevee et 
eliminer au maximum les proteines de haut poids moleculaire. 

15 Precipitation : des precipitations au sulfate d'ammonium (Prolabo - ref 21 

333 365) ont ete effectu^es sur les pools d'urine SEP positif et SEP negatif Le 
pourcentage de 60 % de sulfate d'ammonium sature pour 40 % d'urine, soil 390 
grammes de sulfate d'ammonium par litre d'urine a ete utilise. Chaque pool est reparti 
en fractions de 1,8 litres dans des flacons de 2 litres pour ameliorer la precipitation. La 

20 precipitation a ete effectuee durant 2x8 heures, a temperature ambiante, sous agitation 
douce. Apres centrifugation des pools d'urine a 3 000 tpm pendant 10 min., a une 
temperature de 10°C, le culot obtenu est repris dans un tampon Tris 20 mM contenant 
du CaCb 1 mM et de Puree a 0,25 M. Le melange a ensuite ete centrifuge a 3 000 tpm 
pendant 10 min. Le surnageant contient les proteines concentrees. II est soil utilise 

25 immediatement pour I'etape suivante, soit congele si Tetape suivante ne peut etre 
effectuee en continu. 

Chromatographie par echange d'ions : la solution contenant les proteines a 
ensuite ete passee sur un gel DEAE fast Flow (commercialise par PHARMACIA). Cette 
etape est effectuee a basse pression sur une colonne PHARMACIA remplie de gel. Les 

30 tampons sont amenes sur la colonne par une pompe peristaltique qui permet un debit 
regulier. Le tampon d 'equilibration de la colonne est le tampon Tris 20 mM, pH 7. La 
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fraction correspondant au surnageant de precipitation et contenant une quantite de sels 
trop elevee est dialysee contra ce tampon avant depot sur ia colonne. Une elution par un 
gradient salin permet de recuperer les proteines. Le gradient d'eiution est efFectue par 
palier de NaCI 100, 200, 300, 500 mM dans le tampon d 'equilibration de la colonne. Les 
5 fractions d* elution sont testees par le test MTT et ne seront conservees que les fractions 
positives, soit la fraction eluee a 200 Mm NaCI. Ces fractions pourront etre trait6es 
immediatement ou conservees a I'etat lyophilise. 

Purification : Une chromatographie d' exclusion sterique basee sur la 
difference de taille et de forme des proteines a eluer a ete utilisee. La fraction 

10 correspondant a T elution 200 mM NaCI est deposee sur la colonne. Au cours de 
I'elution, les proteines de faibie masae moleculaire sont retenues et done eluees plus 
tardivement que les grosses molecules. Les purifications ont ete effectuees sur HPLC 
avec une colonne TosoHaas TSK Prep G 3000 SW, d'un diametre de 21,5 mm et d'une 
longueur de 300 mm, la limite d'exclusion en masse moleculaire est de 500 000 daltons . 

15 Le tampon d*etution utilise contient du phosphate 100 mM, du sulfate de sodium 100 
mM, a pH 6,8. La separation du melange de proteines a ete eflfectue en 60 min, Seule la 
fraction correspondant a une masse de 15-20 000 daltons a ete conservee. Cette fraction 
est dialysee dans un tampon Tris 20 mM contenant du CaCh 0,2 mM, pH 7,2, puis 
lyophilisee. 

20 A chaque etape, seules les fractions presentant une activite toxique 

significative ont ete retenues pour 1' etape suivante. Un controle de 1' activite toxique des 
proteines a ete efFectue a chaque etape, a I'aide du test MTT, Seules les fractions 
presentant une activite toxique significative ont ete retenues pour T etape de purification 
supplementaire decrite dans Texemple 3. 

25 

Example 3 : Purification supplementaire des proteines urinaires par 
chromatographie phase inverse. 

Des pools d*urine provenant de patients SEP (poo! SEP positiO et de 
patients non SEP (pool SEP negatiQ, obtenus apres purification selon Texemple 2, ont 
30 ete repris dans de Teau distillee, puis dilues avec une solution 0,2% TFA/10% 
acetonitrile pour obtenir une concentration finale d'environ 130 a 140 |ig/ml. 
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La separation par HPLC phase inverse C8 a ete effectuee sur une colonne 
Brownlee Aquapore (nom commercial) commercialisee par la societe Parkin Elmer 
(caracteristiques de la colonne: 300 angstroms/7 ^tnn/( 100x4,6) mm). Deux colonnes 
distinctes ont ete utilisees respectivement pour les pools positif et negatif. Les injections 
5 ont ete realisees par multi-injections de 250 iil Les proteines ont ete eluees avec un 
gradient lineaire de 5% a 15% de tampon B en 5 min., puis de 15% a 100% de 
tampon B en 95 min., a un debit de 0,5 ml/mi n. Les tampons de separation A et B 
utilises sont respectivement ie tampon 0,1% TFA (Pierce n° 28904)/ eau MilliQ et le 
tampon 0,09% TF A/80% acetonilriie (Baker). La detection a ete effectuee par mesure 

10 de I'absorbance UV a 205 et 280 nm. La collecte des fractions a ete effectuee en 
fractions de 1,5 ml et de 0,5-1 mi dans la zone d'interet. Les fractions ont ete congelees 
apres la collecte dans de la carboglace. 

Les fractions collectees ont ensuite ete sechees en speed vac et reprises 
dans 100 \i\ de 0,1% TF A/30% acetonitrile. 20jil des fractions ont ete transferes dans 

15 des eppendorfs de 500 |il, seches et laves a deux reprises avec 100 \i\ d*eau MilHQ, puis 
seches de nouveau. 

L'activite toxique des proteines contenues dans chaque fraction recueillie 
apres elution a ete determinee a Taide du test MTT. Seule la fraction 21 presentant une 
activite toxique significative a ete retenue. Le numero de cette fraction correspond a 

20 Tordre de Telution en fonction des conditions d 'elution enoncee dans cet exemple. 

Exemple 4: Analyse des proteines obtenues par separation sur FDPLC sur 
gel SDS-TRICINE. 

Le pool de collecte de la fraction 21 obtenue par HPLC, comme decrit 

25 dans Texemple 3, et provenant de 20 injections du pool SEP positif, a ete depose sur un 
gel SDS-TRICINE 16% precoule de 10 puits et de 1 mm d'epaisseur (commercialise 
par la societe Novex). Les conditions d' utilisation du gel correspondent a celles 
preconisees par le fournisseur. L'echantillon est repris dans 75 \x\ du tampon 
d'echantillon 1 fois concentre (SDS-TRICINE N** LC 1 676, 1 ml deux fois concentre + 

30 50^1 de P-mercaptoethanol (Pierce) dilue au 1/2 dans de Peau) et 25^1 de Techantillon 
sont deposes sur le gel en trois fois. Le pool de collecte de la fraction 2 1 provenant de 6 
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injections du pool SEP negatif a ete depose sur le gel dans les memes conditions que 
celles decrites pour le pool SEP positif La migration sur les deux gels a ete effectuee en 
parallele dans la meme cuve de migration (XCELL II NO VEX (nom commercial)) a un 
voltage constant de 125 mV pendant 2 heures. La cuve est placee dans un bac contenant 
5 de la glace. Les gels ont ete colores directement apres la migration par coloration au 
zinc/imidazole (kit de coloration 161-0440 commercialise par la societe BIORAD) pour 
obtenir une coloration negative reversible. Les bandes de proteines sont translucides sur 
fond opaque. 

10 Example 5 : Digestion a la trypsine des bandes de gel. 

Toutes les bandes de proteines visualisees dans les depots de ia fraction 21 
ont ete decoupees et soumises a une proteolyse par la trypsine. 

Les bandes de gels sont decoupees au scalpel en tranches de 1 mm et 
transferees dans des tubes eppendorfs. Les eppendorfs sont soumis a un pic de 

15 centrifiigation pour faire tomber les morceaux de gel et apres centrifligation 100 jil de 
tampon de lavage (100 Mm NH4CO3/50% CH3CN) sont ajoutes aux morceaux de gel. 
Apres 30 min. d*agitation a temperature ambiante, le surnageant est enleve par fractions 
de 20 \i\ et Tetape de lavage est renouvelee deux fois. Les eppendorfs sont seches 
pendant 5 min. en speed vac. 20 \xg de trypsine (Modified sequenal grade PROMEGA 

20 V5111) sont repris dans 200 ^1 de tampon de digestion (5 mM TRIS, pH 8) et sont 
dissous pendant 30 min. a temperature ambiante, sous agitation intermittente et 20 a 30 
^1 de trypsine resuspendue sont ajoutes aux morceaux de gel. Les eppendorfs sont 
centrifuges et conserves en chambre chaude a 2S°C pendant une nuit. Apres digestion 
les bandes de gel peuvent etre utiiisees immediatement pour les mesures de masse ou 

25 congelees pour usage ulterieur. 

Exemple 6 : Digestion chimique au CNBR des bandes de gel. 

Dans I'eventualite d'une proteine resistante aux clivages enzymatiques, en 
particulier a Taction de la trypsine comme decrit dans I'exemple 5, les bandes entre 
30 16kD et 20kD ont ete traitees avec du CNBR. Les bandes de gel, deja utiiisees pour les 
digestions avec la trypsine, sont sechees 5 a 10 min. en speed vac. 
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Une solution de CNBR (FLUKA) a 200 mg/ml a ete preparee dans 70 % acide formique 
(BAKER). 20 |al de cette solution ont ete utilisees pour rehydrater les morceaux de gel. 
La reaction s'est faite pendant 20 h a temperature ambiante et a robscurite. Les peptides 
sont extraits 3 fois 30 min avec 100 ^1 de 0.1 % TFA / 60% Acetonitrile. Les solutions 
5 d'extraction sont reunies et concentrees a 20 Ces echantillons sont dilues 5 fois dans 
0,1 % TFA/eau. Les conditions de separation sont celles decrites pour les peptides de la 
digestion avec la trypsine. 

Exemple 7 : Analyse par spectrometrie MALDI-TOF. 

10 30 |il de tampon d 'extract ion (2 % TP A/50 % acetronitrile) sont ajoutes 

aux echantillons. Les eppendorfs a analyser sont soumis a une centrifugation de 5 min., 
puis a une sonication de 5 min. et fmalement a une centrifugation de 1 min. 
Sur un disque en acier inoxidable, 14 depots de 0,5 \x\ de matrice (acide a-cyano-4- 
hydroxy-trans-cinnamique a saturation dans de Tacetone) sont realises. Une fine couche 

15 microcristalline uniforme est obtenue. 0,5 \x\ d'une solution de 2 % TFA/eau sont 
deposes sur cette sous-couche sur les 14 depots, puis 0,5 |il d'echantillon a analyser 
sont ajoutes. Dans cette goutte ainsi formee, 0,5 ^1 d*une solution a saturation d 'acide 
d'acide a-cyano-4-hydroxy-trans-cinnamique dans 50 % acetonitrile/eau sont ajoutes. 
Apres un sechage a temperature ambiante pendant 30 min., les depots cristallins sont 

20 laves avec 2 pi d'eau qui sont immediatement evacues par un souffle d'air. Tous les 
spectres sont obtenus sur un spectrometre de masse BRUKER BIFLEX (marque de 
commerce) equipe d'un reflectron. Les mesures (90 a 120 tirs laser sur Tensemble du 
depot) sont accumulees pour obtenir un spectre de masse qui soit le plus representatif de 
I'ensemble des peptides presents dans le sandwich matrice-echantillon. Pour chaque 

25 depot, une calibration avec les peptides de I'autolyse de la trypsine a ete faite afin de 
pouvoir utiliser une precision de mesure inferieure a 100 ppm. 

Les recherches dans les banques de donnees ont ete executees dans MS-FIT 
PROTEINPROSPECTOR (http ://prospector. ucsf.edu). Les parametres communs, 
utilises dans ces recherches, sont (1) base de donnees : NCBlnr, (2) une tolerance de 
30 100-50 ppm, (3) les cysteines ne sont pas modifees, (4) les methionines peuvent etre 
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oxydees, (5) gamme de poids moleculaire ; 1000-100000 Da, (6) jusqu*a 3 sites de 
coupure peuvent etre ignores. 

Exemple 8 : Sequenpage N-terminal des peptides de digestion. 

(i) Extraction et separation par HPLC des peptides de digestion. 

Apres les mesures de masse sur la totalite de la digestion, le reste des peptides est extrait 
en 3 fois 30 min. dans un bain de sonication avec 0,1 % TFA/60 % acetonitrile. Les 
solutions d'extraction sont reunies et sechees jusqu'a 20 pi en speed vac. Apres dilution 
dans 80 |al de tampon A (0,1 % TFA/eau), les extractions des bandes de gel, digerees 
avec de la trypsine, sont injectees sur une colonne Cl8/MZ-Vydac/(125xl,6)mm/5 pm. 
L'eiution des peptides se fait a un debit de 150 ^l/min. et dans un gradient allant de 5 % 
de tampon B (0,09 % TFA/80 % acetronitrile) a 40 % de tampon B en 40 min., puis de 
40 % de tampon B a 100 % de tampon B en 10 min. La detection est faite par mesure 
de Tabsorbance UV a 205 nm. La collecte des pics est efFectuee dans des tubes 
eppendorf de 500 fil. Les fractions sont conservees sur la glace et pour la bande de 18- 
20 kD du pool 2 1 SEP positif analysees par spectrometrie de masse MALDI-TOF. 

(ii) Sequen<;:age N-terminal. 

Les fractions ne correspondant qu'a un seui pic de masse ont ete analysees 
par degradation d'Edman sur un sequenceur (Modele 477A PERKFN ELMER/Applied 
Biosystems). Les conditions de sequen^age sont celles decrites par le constmcteur. Une 
micro cartouche a ete utilisee pour le depot des echantillons et les PTH-AminoAcid sont 
identifies avec un systeme HPLC online (Modele 120A PERKIN ELMER/Applied 
Biosystems). 

Le depot de la fraction a sequencer s'est fait en plusieurs depots de 15 ^l 
avec des sechages intermediaires. Le tube ayant contenu le peptide est lave avec 15 \i\ 
d*acide formique 85 % (BAKER). Les sequences d'acides amines correspondent 
toujours aux masses mesurees. Les peptides, dont les masses ne correspondent pas a la 
proteine principale identifiee, ont ete sequences en priorite. De cette maniere, il a ete 
possible d'identifler jusqu'a trois proteines dans une bande de gel. 



Exemple 9 : Resultats et discussion. 
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Apres HPLC inverse du pool temoin SEP negatif et du pool SEP positif, 
Tactivite toxique de chaque fraction d'elution a ete determinee en utilisant le test MTT. 
Seule la fraction 21 du pool SEP positif presente une activite toxique in vitro. La 
fraction 21 du pool temoin SEP negatif ne presente aucune activite toxique. L'activite 
5 toxique de la fraction 21 du pool SEP positif a ete confirmee /// vitro par FACS, comme 
decrit dans la demande de brevet WO 98/1 1439 sur des cellules astrocytaires murines. 

Le contenu proteique de la fraction 21 du pool temoin SEP negatif et du 
pool SEP positif a ete obser^^e apres separation sur gel SDS-TRICINE 16% et 
coloration du gel au zinc/imidazole. Des proteines de poids moleculaires apparents 

10 eleves ont ete trouvees dans las deux fractions. Par centre cinq bandes differentes et de 
poids moleculaires apparents faibles ne sont visibles que dans la fraction 2 1 du pool SEP 
positif (bandes 8, 14. 18 et 20 kD). A chaque bande correspond au moins une proteine 
et des variants desdites proteines qui ont un poids moleculaire apparent proche de celui 
de la proteine native. Ces sequences variantes presentent un pourcentage d'homologie 

15 ou d'identite avec les sequences natives d'au moins 70%, de preference d'au moins 80% 
et avantageusement d'au moins 98 %. 

Les proteines d'interet de la fraction 21 du pool SEP positif ont ensuite ete 
analysees par spectrometrie de masse et/ou sequengage et recherche d'homologie dans 
les banques de donnees. Les resultats montrent la presence de cinq bandes de proteines 

20 migrant antra 22 et 5 kD dans la fraction 21 du pool SEP positif et des variants desdites 
proteines. 

Ces proteines sont le fragment C-terminal du Perlecan, qui commence a 
Tacide amine 3464 et se termine a I'acide amine 3707 de la sequence proteique 
complete, identifiee dans Tidentificateur de sequences SEQ ID N** 2, le precurseur de la 

25 proteine plasmatique de liaison au retinol dont la sequence est donnee en SEQ ID N° 4, 
le precurseur de I'activateur du ganglioside GM2 identifie en SEQ ID N° 8, la 
calgranuline B identifiee en SEQ ID N"* 17 et la saposine B representee en SEQ ID N'' 
24. Comme decrit ci dessus des homologues ou variants desdites proteines ont 
egalement ete identifies par sequen^age. Ces sequences proteiques homologues ou 

30 variantes sont le produit de mutations au niveau des genes codant pour lesdites 
proteines. A titre d'exemple, la SEQ ID N** 9 presente 99 % d'homologie ou d'identite 



avec la SEQ ID N° 8 du precurseur de I'activateur du ganglioside GM2 et le fragment 
de SEQ ID 9 qui commence a Tacide amine 34 et se termine a I'acide amine 202 
presente 98,88 % d'homologie ou d'identite avec le fragment correspondant de la 
proteine native identifiee en SEQ ID N° 8, 

Example 10 : Mise en evidence des proteines dans un echantillon urinaire. 

Des echantillons d'urine provenant d'un individu SEP negatif et d'un 
patient SEP positif ont ete preleves. Ces echantillons d'urine ont ete purifies selon le 
protocole decrit precedemment. Les fractions d'elution finales 21 ont ete analysees 
separement par spectrometrie de masse. Le profil de masse de chaque fraction 
correspondant a chaque echantillon d'urine a ete compare au profil de masse obtenu 
pour les proteines identifiees dans les exemples precedents. Les resultats montrent que 
pour Techantillon d'urine provenant du patient SEP positif les masses correspondent 
aux molecules (i) fragment C-terminal du Perlecan, (ii) precurseur de la proteine 
activatrice du ganglioside GM2, (iii) calgranuline B et (iv) saposine B identifiees 
precedemment. Par contre aucune de ces masses n'a ete identifiee dans le profil de 
masse obtenu apres analyse de Techantillon d'urine provenant de Tindividu SEP negatif 
Le procede decrit est utilisable comme essai de diagnostic. 

Exemple 1 1 : Essai en Western Blot. 

Des Western Blot ont ete realises sur differentes fractions d'urine brute ou 
purifiee comme decrit dans I'exemple 2. Des echantillons d'urine provenant d'individus 
sains et de patients atteints de sclerose en plaques sont testes en parailele. Les 
echantillons sont deposes sur un gel d'electrophorese permettant de separer les 
differentes proteines en fonction de leur masse moleculaire sous Taction d'un champ 
eiectrique. Les Western Blot sont realises apres transfert des proteines du gei sur une 
membrane. Pour reveler les proteines transferees, la membrane est saturee en tampon de 
saturation, puis incubee avec un anticorps directement marque a la phosphatase alcaline. 
L'anticorps utilise est un anticorps anti-calgranuline (anticorps monoclonal de souris, 
clone CF 145 sous-type IgG 2b commercialise par la societe Valbiotech : reference 
MAS 696p lot PC96G696). Le substrat de I'enzyme est le dichlomre de 3,3'-(l,r- 
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biphenyl)4,4'diazonium et 2-naphtalenyl phosphate de sodium (commercialise sous la 
denomination p Naphtyl acid phosphate Sigma ref N7375 et 6 dianisine Tetrazotized 
D3502) est ajoute pour la revelation des bandes et la visualisation des proteines liees a 
Tanticorps. Une molecule de masse moleculaire apparente d'environ 14 000 est revelee 
5 dans les urines purifiees de patients atteints de SEP, avec un signal relativement intense. 
Cette proteine correspond a la calgranuline B (masse moleculaire apparente : 14 IcD). 
Par centre, aucun signal n*est observe a partir d'urine d'individus sains. Cette 
observation confirme la presence de cette proteine specifiquement dans les urines de 
patients atteints de SEP et la mise en oeuvre d'un precede de detection utilisant un 
10 anticorps reconnaissant la proteine. 



Exemple 12 : Production d'anticorps monoclonaux. 

La production d'anticorps monoclonaux par ascite impose une 
compatibilite du systeme H-2 entre rhybridome et la souris productrice. 20 souris 

15 femelles Balb/c, agees de 6 semaines, subissent une injection de 0.5ml de Pristane (2-6- 
10-14 acide tetramethylpentadecane) dans leur cavite peritoneale, pour la production 
d'ascite (Porter et al., 1972). Une semaine a 10 jours plus tard, 5.10* a 10.10* 
hybridomes dilues dans 0.5ml de tampon sterile NaCl 0. 145M, Na2HP04 10 mM, KCL 
2.7 mM, KH2P04 1.5 mM a pH 7.4. sont injectes par vole intraperitoneale. L'ascite 

20 apparait une a deux semaines plus tard. Les liquides d'ascites presents dans la cavite 
peritoneale sont alors recueillis avec une seringue apres incision du peritoine. Le liquide 
recueilli est centrifuge a 3000g pendant 15 minutes a temperature ambiante, filtre sur 
gaze pour eliminer le gras, puis tamponne en ajoutant 1/20*^" de son volume de tris- 
HCL IM a pH 8.0. Cette methode permet d*obtenir des quantites d'anticorps 10 fois 

25 supeiieures a celles obtenues par culture d' hybridomes. 

Les immunoglobulines presentes dans le liquide d'ascite sont relarguees par 
les sels (sulfate d'ammonium ou sulfate de sodium). Le liquide d'ascite est precipite par 
le sulfate d'ammonium 40%. Apres 20 minutes au froid la solution est centrifugee 15 
minutes 8000g a 4°C. Le precipite est lave et resuspendu a froid dans une solution de 

30 sulfate d'ammonium 40% puis de nouveau centrifuge. Le nouveau precipite enrichi en 
IgG est remis en solution dans du tampon PBS et dialyse la nuit centre le tampon Tris- 
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HCi 25 mM, NaCl 150 mM pH 7.4. Parallel ement une colonne d'agarose-Proteine A 
(ou proteine G) (commercialisee sour forme lyophilisee. Pierce) est lavee extensivement 
avec le tampon Tris-HCl 25 mM, NaCl 150mM pH7.4. La solution enrichie en IgG est 
depose sur ia colonne puis la colonne est lavee. Les IgG retenues par la colonne sont 
eluees a pH acide (glycine 200 mM pH 2.8). Les fractions eluees sont neutralisees avec 
un volume de Tris-Base IM pH 10.5. Le contenu en immunoglobulines de chaque 
fraction recueillie est quantifiee par lecture d'absorbance a 280 nm (e l%Jcm = 14.0 
Prahl et Porter 1968). Les fractions riches sont poolees. Le degre de purification des 
IgGs poolees est analyse par electrophorese en gel d'acrylamide en presence de SDS. 
Les IgGs purifiees sont dialysees une nuit centre le tampon Tris-HCI 25 mM, NaCl 
150m.M pH7.4, flltrees sterilement, aliquotccs ct conservees a -20°C. leur concentration 
finale est determinee par lecture de I'absorbance a 280 nm ou par dosage micro-BCA. 
Les peptides immunogenes references SEQ ID N° 58, SEQ ID N*" 54, SEQ ID N° 55, 
SEQ ID N« 56, SEQ ID 57. SEQ ID 58. SEQ ID N° 59 etSEQ ID N** 65 ont 
€t6 utilises pour la production d'anticorps monoclonaux, selon le protocole decrit ci 
dessus. 

Mais, il est a la portee de I'homme du metier de definir d'autres protocoles 
pour la production d'anticorps monoclonaux, par exemple a partir des techniques 
decrites par Kohler et Milstein et par Galfre G. e/ aL precedemment cites ou des 
techniques derivees de celles ci. 

Exemple 13 : Mesure de I'activite des cellules T par proliferation des 
cellules T (Sredni et al.. 1981). 

Les cellules T sont lavees deux fois en milieu de culture pour eliminer toute 
trace d'IL2 presente dans le milieu initial de culture. Des lymphocytes B (EBV-LCL) ou 
des monocytes/macrophages pris comme cellules presentatrices de Tantigene, sont 
irradiees a 10000 rads, lavees deux fois avec du milieu de culture (RPMl). 2.10'' cellules 
T (2.10^ cellules /ml) et 2.10" cellules B autologues irradiees (2.10^ cellules /ml) sont 
incubees ensemble en presence d'une gamme de concentration croissante de I'antigene 
sous un volume final de 200 fil dans des micropuits. Apres 48 heures de culture a 37°C. 
1 fiCi de 3H- thymidine dans 50 ^l de milieu RPMI est ajoute dans chaque puits. Les 
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cellules T, seules a se diviser, incorporent la thymidine tritiee dans I'ADN. Apres 18 
heures de culture, les cellules de chaque micropuits sont recoltees sur des pastilles de 
laine de verre par aspiration. Apres lyse osmotique des cellules, la radioactivite 
incorporee dans PADN est absorbee sur les pastilles (cell Harvester 530, Inotech). 
5 Chaque pastille sechee est piacee dans un tube plastique qui contient 2 ml de scintillant ; 
la radioactivite b adsorbee sur chacune des pastilles est quantifiee dans un compteur beta 
a scientillation liquide (LKB Rackbeta 1217). Les resultats sont exprimes comme 
moyenne arithmetique de cpm /culture ('coups par minute'). 



10 Exemple 14 : Protocole de detection de T association entre les peptides et 

les molecules d*histocompatibilite (approche APC transformees avec un peptide se 
fixant au CMH 1). 

1) Materiel : 

Les sources de molecules d'histocompatibilite sont actuellement de deux 
15 types principaux : les cellules mutantes et les molecules d'histocompatibilite purifiees. 

La cellule mutante utilisee est la cellule humaine T2 qui et un variant de la 
lignee Tl produite par fusion du lymphome T CEM et du lymphome B 72 LI 74 (Salter 
and Cresswell Embo J 1986, 5: 943-949). Cette cellule qui est depourvue de 
transporteurs de peptides contient des chaines lourdes de molecules de classe I libres de 
20 peptides qui vont pouvoir accepter de peptides exogenes. 

Des molecules d'histocompatibilite de classe I purifiees par 
chromatographic d'affmite a partir de lignees de cellules B humaines transformees par 
TEBV peuvent etre egalement utilisees. Dans ce cas les peptides endogenes doivent etre 
elimines par un traitement avec de rureel.5 M et de la soude 12.5 mM (pH 11.7) 
25 pendant 1 heure a 4®C,suivi de leur elimination par una colonne de desalage (PDLO, 
Pharmacia). Les molecules d'histocompatibilite sont immediatement remises en presence 
des peptides a tester dans un tampon PBS avec 0.05% Tween 20, 2 mM EDTA, 0.1% 
NP40 et6mM CHAPS, en presence de 2pg/ml B2m pour faciliter la reassociation 
(Gnjatic et al., Eur J Immunol 1995 25 : 1638-1642). 
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Les peptides testes ont en genera! 8 a 10 residus, parfois 1 J ou 12. lis ont 
ete synthetises par Neosystems (Strasbourg), ou par Chiron mimotopes (Victoria, 
Australie). lis sont utilises a des concentrations variant de 100 yM aO. 1 nM. 

2) Protocole de I'assemblage (Connan et al., Eur J Immunol 1994, 24 : 
5 777 ; Couillin et al. Eur J Immunol 1995, 25 : 728-732). 

Des aliquotes de 8.105 cellules dans un volume de 64 ^il, repartis dans des 
tubes microfuge Eppendorf, sont mis en presence d'un tampon de lyse contenant 10 mM 
PBS, pH 7.5 1% NP40, des inhibiteurs de proteases (I mM PMSF, 100 
iodoacetamide, 2 /ml aprotinine, 10 pM leupeptine, 10 pM pepstatine et 10 pg/ml 

10 inhibiteur de trypsine). La lyse se fait en presence des peptides a tester pendant 30 
minutes ou 1 heure a 37°C. Apres elimination du materiel non soiubiiise par une 
centrifiigation a 15 000 tours /minute k 4°C, le surnageant et additionne de 140 pi de 
PBS contenant 0.05% de Tween 20, 3 mM d'azide de sodium, 1 mM PMSF et 10 
mg /ml d'albumine bovine. Chaque echantillon est incube pendant 20 heures a 4°C dans 

15 2 puits d'une plaque a microtitration de type Nunc,Maxisorb, prealablement recouverts 
d'un anticorps monoclonal (10 pg /ml en PBS) qui reconnait les molecules 
d*histocompatibilite ayant une(des) conformation(s) conforme(s) pour la presentation de 
peptides et semblable(s) a celle(s) presente(s) a la surface des cellules. La plaque 
recouverte d'anticorps est prealablement saturee par de I'albumine bovine a 10 mg /ml 

20 dans du PBS-Tween avant la mise de recfiantillon. Le second anticorps qui permet la 
detection de I'assemblage des molecules d'histocompatibilite est dirige contre la B2m. II 
est couple soit a la biotine (NHS-LC biotin. Pierce) soit a la phsophatase alcaline (P- 
552, Sigma) et est incube a 2 pg /ml pendant une heure a 37°C. Dans le cas de I'emploi 
de la biotine, une incubation de 45 minutes a 20-25X avec de la streptavidine couplee a 

25 la phosphatase alcaline (E-2636, Sigma) est realisee. L'activite de la phosphatase 
alcaline est mesuree en utilisant comme substrat !e 4-methyl-umbellifery!-phosphate (M- 
8883, Sigma) a 100 pM dans de la diethanolamine 50 mM, pH 9.5 avec du MgCI2 1 
mM. La lecture est faite a 340/460 nm a Taide d'un cytofluorimetre. 

3) Stabilite des complexes HLA/peptides : 

30 La stabilite des complexes precites a ete etudiee car elle conditionne la 

bonne presentation de I'antigene et Tinduction de la reponse T. A cet effet, on a utilise 
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soit du HLA purifie, soit le lysat de la cellule T2. Avec le HLA purifie, on a elimine les 
peptides endogenes (comme decrit en 2)) puis on I'a mis en presence du peptide a tester 
en tube Eppendorf a 37°C, pendant des temps variables de quelques minutes a plusieurs 
jours. La phase suivante d'incubation sur plaque de 96 puits (comme decrit en 2) avec 
5 Tanticorps anti-HLA se fait pendant une heure a 37°C. La revelation est effectuee de 
maniere classique. Avec le lysat de la cellule T2, toutes les incubations sont egalement 
faites a STX, apres ajout de tous les inhibiteurs de proteases. 

Example 15 ; Technique d'immunohlstologie. 

10 Les coupes histologique preparees en parafFine sont deparaffinees en xylene 

et alcool avant de subir un pretraitement qui a pour but de demasquer les antigenes ; ce 
pretraitement peut correspondre a (i) deux fois 5 minutes sous micro-onde (750W) en 
presence d'un tampon citrate de sodium, acide citrique, (ii) un traitement a I'acide par 
incubation 15 minutes dans une solution d'acide petiodique 1% ou par incubation 5 

15 minutes dans une solution d 'acide formique 99%. Les peroxydases endogenes sont 
ensuite bloquees par incubation des lames 30 minutes en eau oxygenee 1% puis lavage 
extensif en eau pendant 15 minutes. Le bruit de fond est bloque en incubant les lames 30 
minutes en presence de PBS Triton 0.03%, 10% serum Donkey (pour les anticorps 
polyclonaux) ou 10% serum Goat (pour les anticorps monoclonaux). Un marquage avec 

20 Tanticorps primal re est realise en appliquant 100 a 200 (il de solution d' anticorps 
primaire par lame (0.5 a 5 jjg /ml selon le titre) dans du PBS Triton 0.03% puis en 
incubant 2 heures a temperature ambiante, Les lames sont ensuite rincees 3 fois en PBS- 
Triton pendant 10 minutes. Un marquage anticorps secondaire est realise en utilisant des 
anticorps biotinyles capables de se fixer specifiquement aux anticorps primaires, par 

25 exemples des anti-IgG de lapin ou anti-IgG de souris dilues dans du PBS-Triton 0.03%. 
les lames sont lavees et incubees dans une solution pendant 2 heures (2 ^l complexe 
streptavidine-biotine-peroxides, 1600 )i\ PBS-Triton 0.03%). Les lames sont de nouveau 
lavees avant d'etre revelees a I'abri de la lumiere dans le tampon A puis rincees a Teau 
avant observation microscopique. Tampon A pour 5 lames : 25 ml TrisO.OSM pH 7.6, 

30 2.5 ml Imidazole IM, 15 ml eau sterile, 2 ml DAB 5 mg /ml. 5 mINickel d*ammonium 
10%, 30nlH2O2 1%. 
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USTE DE SEQUENCES 



SEQ ID N° 1 : sequence complete du PerIacan:>gill730508|sp|P98l60|PGBM_HUMAN BASEMENT 
MEMBRANE-SPECIFIC HEPARAN SULFATE 

PROTEOGLYCAN CORE PROTEIN PRECURSOR (HSPG) (PERLECAN) (PLC) 

MGWRAPGALLLALLLHGRLLAVTHGLRAYDGLSLPEDIETVTASQMRWTHSYLSDDEDMLADS 

ISGDDLGSGDLGSGDFQMVYFRALVNFTRSIEYSPQLEDAGSREFREVSEAWDTLESEYLKIPG 

DQWSVVFIKELDGWVFVELDVGSEGNADGAQIQEMLLRVISSGSVASYVTSPQGFQFRRLGTV 

PQFPRACTEAEFACHSYNECVALEYRCDRRPDCRDMSDELNCEEPVLGTSPTFSLLVETTSLPPRP 

ETTIMRQPPVTHAPQPLLPGSVRPLPCGPQEAACRNGHCIPRDYLCDGQEDCEDGSDELDCGPPP 

PCEPNEFPCGNGHCALfCLWRCDGDFDCEDRTDEANCPTKRPEEVCGPTQFRCVSTNMCIPASFH 

CDEESDCPDRSDEFGCMPPQVVTPPRESIQASRGQTVTFTCVAIGVPAPFLINWRLNWGHIPSQPR 

VTVTSEGGRGTLIIRDVKESDQGAYTCEAMNARGMVFGIPDGVLELVPQRAGPCPDGHFYLEHS 

AACLPCFCFGITSVCQSTRRFRDQIRLRFDQPDDFKGVNNO'MPAQPGTPPLSSTQLQIDPSLHEFQ 

LVDLSRRFLVHDSFWALPEQFLGNKVDSYGGSLRYNVRYELARGMLEPVQRPDWLVGAGYRL 

LSRGHTPTQPGALNQRQVQFSEEHWVHESGRPVQRAELLQVLQSLEAVLIQTVYNTKMASVGLS 

DIAMDTTVTHATSHGRAHSVEECRCPIGYSGLSCESCDAHFTRVPGGPYLGTCSGCSCNGHASSC 

DPV/GHCLNCQWITEGPQCKKCKAGFFCDAMKATATSCRPCPCPYIDASRRFSDTCFLDTDGQ 

ATCDACAPGYTGRRCESCAPGYEGNPIQPGGKCRPVNQEIVRCDERGSMGTSGEACRCKNNW 

GRLCNECADRSFHLSTRNPDGCLKCFCMGVSRHCTSSSWSRAQLHGASEEPGHFSLTNAASTHT 

TNEGIFSPTPGELGFSSFHRLLSGPYFWSLPSRFLGDKVTSYGGELRFTVTQRSQPGSTPLHGQPLV 

VLQGNNIILEHHVAQEPSPGQPSTFIVPFREQAWQRPDGQPATREHLLMALAGIDTLLIRASYAQ 

QPAESRVSGISMDVAVPEETGQDPALEVEQCSCPPGYRGPSCQDCDTGYTRTPSGLYLGTCERCS 

CHGHSEACEPETGACQGCQHHTEGPRCEQCQPGYYGDAQRGTPQDCQLCPCYGDPAAGQAAH 

TCFLDTDGHPTCDACSPGHSGRHCERCAPGYYGNPSQGQPCQRDSQVPGPIGCNCDPQGSVSSQ 

CDAAGQCQCKAQVEGLTCSHCRPHHFHLSASNPDGCLPCFCMGITQQCASSAYTRHLISTHFAP 

GDFQGFALVNPQRNSRLTGEFTVEPVPEGAQLSFGNFAQLGHESFYWQLPETYQGDKVAAYGG 

KLRYTLSYTAGPQGSPLSDPDVQITGNNIMLVASQPALQGPERRSYEIMFREEFWRRPDGQPATR 

EHLLMALADLDELLIRATFSSVPLVASISAVSLEVAQPGPSNRPRALEVEECRCPPGYIGLSCQDC 

APGYTRTGSGLYLGHCELCECNGHSDLCHPETGACSQCQHNAAGEFCELCAPGYYGDATAGTP 

EDCQPCACPLTNPENMFSRTCESLGAGGYRCTACEPGYTGQYCEQCGPGYVGNPSVQGGQCLP 

ETNQAPLWEVHPARSIVPQGGSHSLRCQVSGRGPHYFYWSREDGRPVPSGTQQRHQGSELHFPS 

VQPSDAGVYICTCRNLHRSNTSRAELLVTEAPSiCPITVTVEEQRSQSVRPGADVTFICTAKSKSPA 

VTLVWTRLHNGKLPTRAMDFNGILTIRNVQLSDAGTYVCTGSNMFAMDQGTATLHVQASGTLS 

APWSIHPPQLTVQPGQLAEFRCSATGSPTPTLEWTGGPGGQLPAKAQIHGGILRLPAVEPTDQA 

QYLCRAHSSAGQQVARAVLHVHGGGGPRVQVSPERTQVHAGRTVRLYCRAAGVPSATITWRK 

EGGSLPPQARSERTDIATLLIPAITTADAGFYLCVATSPAGTAQARIQWVLSASDASQPPVKIESS 

SPSVTEGQTLDLNCVVAGSAHAQVTWYRRGGSLPHHTQVHGSRLRLPQVSPADSGEYVCRVEN 

GSGPKEASITVSVLHGTHSGPSYTPVPGSTRPrRrEPSSSHVAEGQTLDLNCWPGQAHAQVTWH 

KRGGSLPARHQTHGSLLRLHQVTPADSGEYVCHWGTSGPLEASVLVTIEASVIPGPIPPVRIESSS 

STVAEGQTLDLSCWAGQAHAQVTWYKRGGSLPARHQVRGSRLYIFQASPADAGQYVCRASN 

GMEASITVTVTGTQGANLAYPAGSTQPIR1EPSSSQVAEGQTLDLNC\A^GQSHAQVTWHKRGG 

SLPVRHQTHGSLLRLYQASPADSGEYVCRVLGSSVPLEASVLVTIEPAGSVPALGVTPTVRIESSS 

SQVAEGQTLDLNCLVAGQAHAQVTWHKRGGSLPARHQVHGSRLRLLQVTPADSGEYVCRWG 

SSGTQEASVLVTIQQRLSGSHSQGVAYPVRIESSSASLANGHTLDLNCLVASQAPHTITWYKRGG 

SLPSRHQIVGSRLRIPQVTPADSGEYVCHVSNGAGSRETSLIVTIQGSGSSHVPRVSPPIRJESSSPT 

WEGQTLDLNCWARQPQAIITWYKRGGSLPSRHQTHGSHLRLHQMSVADSGEYVCRANNNID 

ALEASl\nSVSPSAGSPSAPGSSMPIRlESSSSHVAEGETLDLNCVWGQAHAQVTWHKRGGSLPS 

YHQTRGSRLRLHHVSPADSGEYVCRVMGSSGPLEASVLVTIEASGSSAVHVPAPGGAPPIRIEPSS 

SRVAEGQTLDLKCWPGQAHAQVTWHKRGGNLPARHQVHGPLLRLNQVSPADSGEYSCQVTG 

SSGTLEASVLVTIEPSSPGPIPAPGLAQPIYIEASSSHVTEGQTLDLNCWPGQAHAQVTWYKRGG 

SLPARHQTHGSQLRLHHVSPADSGEYVCRAAGGPGPEQEASFTVTVPPSEGSSYRLRSPVISIDPP 

SSTVQQGQDASFKCLIHDGAAPISLEWKTRNQELEDNVHISPNGSIITIVGTRPSNHGTYRCVASN 

AYGVAQSV\^SVHGPPTVS\^PEGPVWVKVGKAVTLECVSAGEPRSSARWTRISSTPAKLEQR 
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TYGLMDSHTVLQISSAKPSDAGTYVCLAQNALGTAQKQVEVIVDTGAMAPGAPQVQAEEAELT 
VEAGHTATLRCSATGSPARTIHWSKLRSPLPWQHRLEGDTLIIPRVAQQDSGQYICNATSPAGHA 
EATllLHVESPPYATTVPEHASVQAGETVQLQCLAHGTPPLTFQWSRVGSSLPGRATARNELLHF 
ERAAPEDSGRYRCRVTNKVGSAEAFAQLLVQGPPGSLPATSIPAGSTPTVQVTPQLETKSIGASV 
5 EFHCAVPSDRGTQLRWFKEGGQLPPGHSVQDGVLRIQNLDQSCQGTYICQAHGPWGKAQASAQ 
LN^QALPSVLINIRTSVQTVWGHAVEFECLALGDPKPQVTWSKVGGHLRPGIVQSGGVVRIAHV 
ELADAGQYRCTATNAAGTTQSHVLLLVQALPQISMPQEVRVPAGSAAVFPCIASGYPTPDISWS 
!a.DGSLPPDSRLENNMLMLPSVQPQDAGTYVCTATmQGKVKAFAHLQVPER\A/TYF^ 
FLPLPTIKDAYRKFEIKITFRPDSADGMLLYNGQKRVPGSPTNLANRQPDFISFGLVGGRPEFRFD 

10 AGSGMATIRHPTPLALGHFHTVTLLRSLTQGSLIVGDLAPVNGTSQGKFQGLDLNEELYLGGYPD 
YGAlPKAGLSSGFiGCVRELRlQGEElVFHDLNLTAHGlSHCPTCRDRPCQNGGQCHDSESSSYVC 
VCPAGFTGSRCEHSQALHCHPEACGPDATCVNRPDGRGYTCRCHLGRSGLRCEEGVTVTTPSLS 
GAGSYLALPALTNTKHELRLDVEFKPLAPDGVLLFSGGKSGPVEDFVSLAMVGGHLEFRYELGS 
GLAVLRTAEPLALGRW^VSAERLNKDGSLRVNGGRPVLRSSPGKSQGLNLHTLLYLGGVEPSV 

15 PLSPATNMSAHFRGCVGEVSVNGKRLDLTYSFLGSQGIGQCYDSSPCERQPCQHGATCMPAGEY 
EFQCLCRDGIKGDLCEHEENPCQLREPCLHGGTCQGTRCLCLPGFSGPRCQQGSGHGIAESDWH 
LEGSGGNDAPGQYGAYFHDDGFLAFPGHVFSRSLPEVPETIELEVRTSTASGLLLWQGVEVGEA 
GQGKDFISLGLQDGHLVFRYQLGSGEARLVSEDPINDGEWHRVTALREGRRGSIQVDGEELVSG 
RSPGPNVAVNAKGSlYIGGAPDVATLTGGRFSSGlTGCVK^a.VLHSARPGAPPPQPLDLQHRAQA 

20 GANTRPCPS 

SEQ ID N°2 

DAPGQYGAYF HDDGFLAFPG HVFSRSLPEV PETIELEVRT STASGLLLWQ GVEVGEAGQG 60 
KDFISLGLQD GHLVFRYQLG SGEARLVSED PINDGEWHRV TALREGRRGS IQVDGEELVS 120 
25 GRSPGPNVAV NAKGSVYIGG APDVATLTGG RFSSGITGCV KNLVLHSARP GAPPPQPLDL 180 
QHRAQAGANT RPCPS 

SEQ ID N° 3 >gi|503 i773IrcriNP_005520.IIpHSPG2I heparan siilfaie proteoglycan 2 (perlecan); 
HSPG - un fragment -de la sequence dii Pcrleacan SEQ IN N° 3 

30 RTCRCKNNWGRLCNECADRSFHLSTRNPDGCLKCFCMGVSRHCTSSSWSRAQLHGASEEPGHF 
SLTNAASTHTTNEGIFSPTPGELGFSSFtlRLLSGPYFWSLPSRFLGDKVTSYGGELRFTVTQRSQP 
GSTPLHGQPLWLQGNNLILEHHVAQEPSPGQPSTFIVPFREQAWQRPDGQPATREHLLMALAGI 
DTLLIRASYAQQPAESRLSGISMDVAVPEETGQDPALEVEQCSCPPGYLGPSCQDCDTGYTRTPS 
GLYLGTCERCSCHGHSEACEPETGACQGCQHHTEGPRCEQCQPGYYGDAQRGTPQDCQLCPCY 

35 GDPAAGQAALTCFLDTDGHPTCDACSPGHSGRHCERCAPGYYGNPSQGQPCQRDSQVPGPIGC 
NCDPQGSVSSQCDAAGQCQCKAQVEGLTCSHCRPHHFHLSASNPDGCLPCFCMGITQQCASSAY 
TRHLISTHFAPGDFQGFALVNPQRNSRLTGEFTVEPVPEGAQLSFGNFAQLGHESFYW 

SEQ ID N*'4 

40 MKWVWALLLL AAWAAAERDC RVSSFRVKEN FDKARFSGTW YAMAKKDPEG LFLQDNIVAE 60 
FSVDETGQMS ATAKGRVRLL NNWDVCADMV GTFTDTEDPA KFKMKYWGVA SFLQKGNDDH 120 
WIVDTDYDTY AVQYSCRLLN LDGTCADSYS FVFSRDPNGL PPEAQKIVRQ RQEELCLARQ 180 
YRLI VHNGYC DGRSERNLL 

45 SEQ ID N*» 5 >gill32404|splP02753|RETB HUMAN PLASMA RETINOL-BINDING PROTEIN 
PRECURSOR (PRBP) 
(RBP) 

MKWVWALLLLAAWAAAERDCRVSSFRVKENFDKARFSGTWYAMAKKDPEGLFLQDNIVAEFS 
VDETGQMSATAKGRVRLLNNWDVCADMVGTFTDTEDPAKFKMKYWGVASFLQKGNDDHWl 
50 VDTDYDTYAVQYSCRLLNLDGTCADSYSFVFSRDPNGLPPEAQKIVRQRQEELCLARQYRLIVH 
NGYCDGRSERNLL 

SEQ ID N° 6>gi}72085ipirllVAHU plasma relinol-binding prolein precursor - human 
MKWVWALLLLAAWAAAERDCRVSSFRVKENFDKARFSGTWYAMAKKDPEGLFLQDNIVAEFS 
55 VDETGQMSATAKGRVRLLNNWDVCADMVGTFrDTEDPAKFKMKYWGVASFLQKGNDDHWI 
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VDTDYDTYAVQYSCRLLNLDGTCADSYSFVFSRDPNGLPPEAQKIVRQRQEELCLARQYRLIVH 
NGYCDGRSERNLL 

SEQ ID N° 7>gi|225862|prnjI40I251A retinol binding protein [Homo sapiens] 
5 ERDCRVSSFRVK£NFDKARFSGTWYAMAKKDPEGLFLQDNIVAEFSVDETGQMSATAKGRVRL 
LNNWDVCADMVGTFTDTEDPAKFKMKYWGVASFLQKG>roDHWIVT>TOYDTYAVQYSCRLL 
NLDGTCADSYSFVFSRDPNGLPPEAQKIVRQRQEELCLARQYRLIVHNGYCDGRSERNL 

SEQ ID N°8 

10 MQSLMQAPLL lALGLLLATP AQAHLKKPSQ LSSFSWDNCD EGKDPAVIRS LTLEPDPIW 
PGNVTLSWG STSVPLSSPL KVDLVLEKEV AGLWIKIPCT DYIGSCTFEH FCDVLDMLIP 
TGEPCPEPLR TYGLPCHCPF KEGTYSLPKS EFWPDLELP SWLTTGNYRI ESVLSSSGKR 
LGCIKIAASL KGI 

15 SEQ ID N°9 

MQSLMQAPLL lALGLLLATP AQAHLKKPSQ LSSFSWDNCF EGKDPAVIRS LTLEPDPIW 
PGNVTLSWG STSVPLSSPL KVDLVLEKEV AGLWIKIPCT DYIGSCTFEH FCDVLDMLIP 
TGEPCPEPLR TYGLPCHCPF KEGTYSLPKS EFAVPDLELP SWLTTGNYRI ESVLSSSGKR 
LGCIKIAASL KGI 

20 

SEQ ID N** 10 >gi|226416!prIl|15n095A Gin2 aciivaior protein (Homo sapiens] 

LLATPAQAHLKKPSQLSSFSWDNCDEGKDPAVIRSLTLEPDPIWPGNVTLSWGSTSVPLSSPLK 
VDLV 

LEKEVAGLWIKIPCTDYIGSCTFEHFCDVLDMLIPTGEPCPEPLRTYGLPCHCPFKEGTYSLPKSEF 
25 WP 

DLELPSWLTTGNYRIESVLSSSGKRLGCIKIAASLKGI 

SEQ ID N** 1 1 >gij3 1857|einbjCAA43408. I| GM2-activator protein 

RAGPPFPMQSLMQAPLLIALGLLLAAPAQAHLKKPSQLSSFSWDNCDEGKDPAVIRSLTLEPDPn 
30 VPGN 

VTLSVMGSTSVPLSSPLKVDLVLEKEVAGLWIKIPCTDYIGSCTFEHFCDVLDMLIPTGEPCPEPL 
RTYG 

LPCHCPFKEGTYSLPKSEFWPDLELPSWLTTGNYRIESVLSSSGKRLGCIKIAASLKGI 

35 SEQ ID N° 12 >gi|6734 16|eiTiblCAA43994. 1| GM2 activator protein 

MQAPLLIALGLLLATPAQAHLKI<PSQLSSFSWDNCDEGKDPAVIRSLTLEPDPIVVPGNVTLSW 
GSTSV 

PLSSPLKVDLVLEKEVAGLWIKIPCTDYIGSCTFEHFCDVLDMLIPTGEPCPEPLRTYGLPCHCPFK 
EGT 

40 YSLPKSEFWPDLELPSWLTTGNYRIESVLSSSGKRLGCIKIAASLKGI 
SEQID N° 13 >gil2135302|pir||I54178 GM2-activator protein - human 

MQSLMQAPLLIALGLLLATPAQAHLKKPSQLSSFSWDNCDEGKDPAVIRSLTLEPDPIWPGNVT 
LSWG 

45 STSVPLSSPLKVDL\^EKEVAGLWIKIPCTDYIGSCTFEHFCDVLDMLIPTGEPCPEPLRTYGLPCH 
CPF 

KEGTYSLPKSEFWPDLELPSWLTTGNYRIESVLSSSGKRLGCIKIAASLKGI 

SEQIDN° 14>gi|4587479jgb|AAD25741.11AF124719 I GM2 activator protein 
50 MQSLMQAPLLIALGLLLATPAQAHLKKPSQLSSFSWDNCDEGKDPAVIRSLTLEPDPIWPGNVT 
LSWG I 

STSVPLSSPLKVDLVLEKEVAGLWIKIPCTDYIGSCTFEHFCDVLDMLIPTGEPCPEPLRTYGLPCH 
CPF 

KEGTYSLPKSEFWPDLELPSWLTTGNYRIESVLSSSGKRLGCIKIAASLKGI 

55 
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SEQ ID N** 15 >gi|4504029|rcnNP_000396.llpGM2AI GM2 ganglioside activalor protein 

MQSLMQAPLUALGLLLATPAQAHLKKPSQLSSFSWDNCDEGKDPAVlRSLTLEPDPl\Aa>GNVT 
LSWG 

STSVPLSSPLKVDLVLEKEVAGLWIKIPCTDYIGSCTFEHFCDVLDMLIPTGEPCPEPLRTYGLPCH 
5 CPF 

KEGTYSLPKSEFWPDLELPSWLTTGNYRIESVLSSSGKRLGCIKIAASLKGI 

SEQ ID N° 16 >gi|266988|sp|P 1790015 AP3_HUMAN GANGLIOSIDE GM2 ACTIVATOR 
PRECURSOR 

10 (CEREBROSIDE SULFATE ACTIVATOR PROTEIN) (SHINGOLIPID ACTIVATOR PROTEIN 3) 

(SAP-3) 

MQSLMQAPLLIALGLLLATPAQAHLKKPSQLSSFSWDNCDEGKDPAVIRSLTLEPDPIVVPGNVT 

LSWGSTSVPLSSPLKVDLVLEKEVAGLWIKIPCTDYIGSCTFEHFCDVLDMLIPTGEPCPEPLRTY 

GLPCHCPF 

15 KEGTYSLPKSEFWPDLELPSWLTTGNYRIESVLSSSGKRLGCIKIAASLKGI 

SEQ ID N** 17 >gi|225793|prf||]3l3351B Ca binding protein MRP14 fHomo sapiens] 

MTCKMSQLERNIETIINTFHQYSVKLGHPDTLNQGEFKELVRKDLQNFLKKENKNEKVIEHIMED 

LDTNADKQLSFEEFIMLMARLTWASHEKMHEGDEGPGHHHKPGLGEGTP 

20 

SEQ ID N° 18>gijl 15442|sp|P05109JS108_HUMAN CALGRANULIN A (MIGRATION INHIBITORY 
FACTOR-RELATED PROTEIN 8) (MRP-8) (CYSTIC FIBROSIS ANTIGEN) (CFAG) (P8) 
(LEUKOCYTE LI COMPLEX LIGHT CHAIN) (SlOO CALCIUM-BINDING PROTEIN A8) 
MLTELEKALNSIIDVYHKYSLIKGNFHAVYRDDLKKLLETECPQYIRKKCADVWFKELDINTDG 
25 AVNFQEFLILVIKMGVAAHKKSHEESHKE 

SEQ ID 19>gil2307565|sp|P805lltSll2_HUMAN CALGRANULIN C (CAGC) (P6) (CGRP) 
(NEUTROPHILS 100 PROTEIN) (CALCIUM-BINDING PROTEIN IN AMNIOTIC FLUID 1) 
(CAAFl) 

30 MTKLEEHLEGIVNIFHQYSVRKGHFDTLSKGELKQLLTKELANTIKNIKDKAVIDEIFQGLDANQ 
DEQVDFQEFISLVAIALKAAHYHTHKE 

SEQ ID N° 20>gi|n5444|splP06702|S109_HUMAN CALGRANULIN B (MIGRATION INHIBITORY 
FACTOR-RELATED PROTEIN 14) (MRP-I4) (P14) (LEUKOCYTE LI COMPLEX HEAVY 
35 CHAIN) 

(SIOO CALCIUM-BINDING PROTEIN A9) 

MTCKMSQLERNIETIINTFHQYSVKLGHPDTLNQGEFKELVRKDLQNFLKKENKNEKVIEHIMED 
LDTNADKQLSFEEFIMLMARLTWASHEKMHEGDEGPGHHHKPGLGEGTF 

40 SEQ ID N° 2i >gi(2 l46972(pir||JC4891 SIOO AI2 protein - human 

TKLEEHLEGIVNIFHQYSVRKGHFDTLSKGELKQLLTKELANTIKNIKDKAVIDEIFQGLDANQDE 
QVDFQEFISLVAIALKAAHYHTHKE 

SEQ ID N° 22 >gi|6253 10|pir1|BCHUCF calcium-binding protein MRP-8 - human 
45 MLTELEKALNSIIDVYHKYSLIKGNFHAVYRDDLKKLLETECPQYIRKKGADVWFKELDINTDG 
AVNFQEFLILVIKMGVAAHKKSHEESHKE 

SEQ ID N° 23 >gi|2J 193691pirjlJC4712 amnioiic fluid-l calcium-binding protein homologue - 
human 

50 MTKLEEHLEGIVNIFHQYSVRKGHFDTLSKGELKQLLTKELANTIKNIKDKAVIDEIFQGLDANQ 
DEQVDFQEFISLVAIALKAAHYHTHKE 

SEQ ID N°24 

DNGDVCQDCI QMVTDIQTAV RTNSTFVQAL VEHVKEECDR LGPGMADICK NYISQYSEIA 60 
55 IQMMMHMQDQ QPKEICALVG FCDEV 85 
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SEQ ID N° 25>gi|4506905|rellNP_000533.1|pSFTPBl surfactant, pulmonary-associated protein B 
MAESHLLQWLLLLLPTLCGPGTAAWTTSSLACAQGPEFWCQSLEQALQCRALGHCLQEVWGH 
VGADDLCQECEDIVHILNKMAK£AIFQDTMRJ<JFLEQECNVLPLKLLMPQCNQ\^ 
5 FQNQIDSNGICMHLGLCKSRQPEPEQEPGMSDPLPKPLRDPLPDPLLDKLVLPVLPGALQARPGP 
HTQDLSEQQFPIPLPYCWLCRALIKRIQAMIPKGALRVAVAQVCRWPLVAGGICQCLAERYSVI 
LLDTLLGRMLPQLVCRLVLRCSMDDSAGPRSPTGEWLPRDSECHLCMSVTTQAGNSSEQAIPQA 
MLQACVGSWLDREKCKQFVEQHTPQLLTLVPRGWDAHTTCQALGVCGTMSSPLQCIHSPDL 

10 SEQ ID 26 >gi|13 l418|spIP07988|PSPB_HUMAN PULMONARY SURF ACT ANT- ASSOCIATED 
PROTEIN B 

PRECURSOR (SP-B) (6 KD PROTEIN) (PULMONARY SURFACTANT- ASSOCIATED 
PROTEOLIPID SPL(PHE)) (18 KD PULMONARY-SURFACTANT PROTEIN) 
MAESHLLQWLLLLLPTLCGPGTAAWTTSSLACAQGPEFWCQSLEQALQCRALGHCLQEVWGH 
15 VGADDLCQECEDlVHILNKMAKEAlFQDTMRiCFLEQECNVLPLKLLMPQCNQVLDDYFPLVlDY 
FQNQTDSNGICMHGLCKSRQPEPEQEPGMSDPLPKPLRDPLPDPLLDKLVLPVLPGALQARPGPH 
TQDLSEQQFPIPLPYCWLCRALIKRIQAMIPKGALAVAVAQVCRWPLVAGGICQCLAERYSVIL 
LDTLLGRMLPQLVCRLVLRCSMDDSAGPRSPTGEWLPRDSECHLCMSVTTQAGNSSEQAIPQAM 
LQACVGSWLDREKCKQFVEQHTPQLLTLVPRGWDAHTTCQALGVCGTMSSPLQCIHSPDL 

20 

SEQ ID N° 27 >gi|71980|pirllLNHUB pulmonary surfactant protein B precursor - human 
MAESHLLQWLLLLLPTLCGPGTAAWTTSSLACAQGPEFWCQSLEQALQCRALGHCLQEVWGH 
VGADDLCQECEDIVHILNKMAKEAIFQDTMRKFLEQECNVLPLKLLMPQCNQVLDDYFPLVIDY 
FQNQTDSNGICMHLGCKSRQPEPEQEPGMSDPLPKPLRDPLPDPLLDKLVLPVLPGALQARPGPH 
25 TQDLSEQQFPIPLPYCWCRALIKRIQAMIPKGALRVAVAQVCRWPLVAGGICQCLAERYSVILL 
DTLLGRMLPQLVCRLVLRCSMDDSAGPRSPTGEWLPRDSECHLCMSVTTQAGNSSEQAIPQAML 
QACVGSWLDREKCKQFVEQHTPQLLTLVPRGWDAHTTCQALGVCGTMSSPLQCIHSPDL 

SEQ ID N*' 28 >gilI360694|pir||SAHUP saposin precursor - human 

30 MYALFLLASLLGAALAGPVLGLKECTRGSAVWCQNVKTASDCGAVKHCLQTNAVNKPTVKSLP 
CDICKDWTAAGDMLKDNATEEEILVYLEKTCDWLPKPNMSASCKEIVDSYLPVILDllKGEMSR 
PGEVCSALNLCESLQKHLAELNHQKQLESNKIPELDMTEWAPFMANIPLLLYPQDGPRSKPQPK 
DNGDVCQDCIQMVTDIQTAVRTNSTFVQALVEHVKEECDRLGPGMADICKNYISQYSEIAIQMM 
MHMQDQQPKEICALVGFCDEVKEMPMQTLVPAKVASKNVIPALELVEPIKKHEVPAKSDVYCE 

35 VCEFLVKEVTKLIDNNKTEKEILDAFDKMCSKLPKSLSEECQEVAO^TYGSSILSILLEEVSPELVC 
SMLHLCSGTRLPALTVHVTQPKDGGFCEVCKKLVGYLDRNLEKNSTKQEILAALEKGCSFLPDP 
YQKQCDQFVAEYEPVLIEILVEVMDPSFVCLKIGACPSAHKPLLGTEKCIWGPSYWCQNTETAA 
QCNAVEHCKRHVWN 

40 SEQ ID N*» 29 >giil34218|sp|PO7602|SAP_HUMAN PRO ACTIVATOR POLYPEPTIDE 
PRECURSOR [CONTAINS: 

SAPOSIN A (PROTEIN A); SAPOSIN B (SPHINGOLIPID ACTIVATOR PROTEIN 1) (SAP-1) 
(DISPERSIN) (SULFATIDE/GMl ACTIVATOR); SAPOSIN C (CO-BET A-GLUCOSIDASE) (Al 
ACTIVATOR) (GLUCOSYLCERAMIDASE ACTIVATOR) (SPHINGOLIPID> 

45 MYALFLLASLLGAALAGPVLGLKECTRGSAVWCQNVKTASDCGAVKHCLQTVWNKPTVKSLP 
CDICKDWTAAGDMLKDNATEEEILVYLEKTCDWLPKPNMSASCKEIVDSYLPVILDIIKGEMSR 
PGEVCSALLCESLQECHLAELNHQKQLESNKIPELDMTEWAPFMANIPLLLYPQDGPRSKPQPKD 
NGDVCQDCIQMVTDIQTAVRTNSTFVQALVEHVKEECDRLGPGMADICKNYISQYSEIAIQMM 
NIHMQPKEICALVGFCDEVKEMPMQTLVPAKVASKNVIPALELVEPIKKHEVPAKSDVYCEVCE 

50 FLVKEVTKLIDNNKTEKEILDAFDKMCSKLPKSLSEECQEWDTYGSSILSILLEEVSPELVCSML 
HLCSGTRLPALTVHVTQPKDGGFCEVCKKLVGYLDRNLEKNSTKQEILAALEKGCSFLPDPYQK 
QCDQFVAEYEPVLIEILVEVMDPSFVCLKIGACPSAHKPLLGTEKCIWGPSYWCQNTETAAQCN 
AVEHCKRHVWN 
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SEQ ID N** 30>gi|186542[gb|J039I2.l|HUMIRBPM Human interstitial rclinol binding protein 
(IRBP) mRNA, complete cds 

ATGAGAGAATGGGTTCTGCTCATGTCCGTGCTGCTCTGTGGCCTGGCTGGCCCCACACACCT 
GTTCCAGCCAAGCCTGGTGCTGGACATGGCCAAGGTCCTCTTGGATAACTACTGCTTCCCG 
5 GAGAACCTGCTGGGCATGCAGGAAGCCATCCAGCAGGCCATCAAGAGCCATGAGATTCTG 
AGCATCTCAGACCCGCAGACGCTGGCCAGTGTGCTGACAGCCGGGGTGCAGAGCTCCCTGA 
ACGATCCTCGCCTGGTCATCTCCTATGAGCCCAGCACCCCCGAGCCTCCCCCACAAGTCCCA 
GCACTCACCAGCCTCTCAGAAGAGGAACTGCTTGCCTGGCTGCAAAGGGGCCTCCGCCATG 
AGGTTCTGGAGGGTAATGTGGGCTACCTGCGGGTGGACAGCGTCCCGGGCCAGGAGGTGCT 

10 GAGCATGATGGGGGAGTTCCTGGTGGCCCACGTGTGGGGGAATCTCATGGGCACCTCCGCC 
TTAGTGCTGGATCTCCGGCACTGCACAGGAGGCCAGGTCTCTGGCATTCCCTACATCATCTC 
CTACCTGCACCCAGGGAACACCATCCTGCACGTGGACACTATCTACAACCGCCCCTCCAAC 
ACCACCACGGAGATCTGGACCTTGCCCCAGGTCCTGGGAGAAAGGTACGGTGCCGACAAG 
GATGTGGTGGTCCTCACCAGCAGCCAGACCAGGGGCGTGGCCGAGGACATCGCGCACATCG 

15 TTAAGCAGATGCGCAGGGCCATCGTGGTGGGCGAGCGGACTGGGGGAGGGGCCCTGGACC 
TCCGGAAGCTGAGGATAGGCGAGTCTGACTTCTTCTTCACGGTGCCCGTGTCCAGGTCCCTG 
GGGCCCCTTGGTGGAGGCAGCCAGACGTGGGAGGGCAGCGGGGTGCTGCCCTGTGTGGGG 
ACTCCGGCCGAGCAGGCCCTGGAGAAAGCCCTGGCCATCCTCACTCTGCGCAGCGCCCTTC 
CAGGGGTAGTCCACTGCCTCCAGGAGGTCCTGAAGGACTACTACACGCTGGTGGACCGTGT 

20 GCCCACCCTGCTGCAGCACTTGGCCAGCATGGACTTCTCCACGGTGGTCTCCGAGGAAGAT 
CTGGTCACCAAGCTCAATGCCGGCCTGCAGGCTGCGTCTGAGGATCCCAGGCTCCTGGTGC 
GAGCCATCGGGCCCACAGAAACTCCTTCTTGGCCCGCGCCCGACGCTGCAGCCGAAGACTC 
ACCAGGGGTGGCCCCAGAGTTGCCTGAGGACGAGGCTATCCGGCAAGCACTGGTGGACTCT 
GTGTTCCAGGTGTCGGTGCTGCCAGGCAATGTGGGCTACCTGCGCTTCGATAGTTTTGCTGA 

25 CGCCTCCGTCCTGGGTGTGTTGGCCCCATATGTCCTGCGCCAGGTGTGGGAGCCGCTACAG 
GACACGGAGCACCTCATCATGGACCTGCGCCACAACCCTGGAGGGCCATCCTCTGCTGTGC 
CCCTGCTCCTGTCCTACTTCCAGGGCCCTGAGGCCGGCCCCGTGCACCTCTTCACCACCTAT 
GATCGCCGCACCAACATCACGCAGGAGCACTTCAGCCACATGGAGCTCCCGGGCCCACGCT 
ACAGCACCCAACGTGGGGTGTATCTGCTCACCAGCCACCGCACCGCCACGGCCGCGGAGGA 

30 GTTCGCCTTCCTTATGCAGTCGCTGGGCTGGGCCACACTGGTAGGTGAGATCACCGCGGGC 
AACCTGCTGCACACCCGCACGGTGCCGCTGCTGGACACACCCGAAGGCAGCCTCGCGCTCA 
CCGTGCCGGTCCTCACCTTCATCGACAATCACGGCGAGGCCTGGCTGGGTGGTGGAGTGGT 
GCCCGATGCCATCGTGCTGGCCGAGGAGGCCCTGGACAAAGCCCAGGAAGTGCTGGAGTTC 
CACCAAAGCCTGGGGGCCTTGGTGGAGGGCACAGGGCACCTGCTGGAGGCCCACTATGCTC 

35 GGCCAGAGGTCGTGGGGCAGACCAGTGCCCTCCTGCGGGCCAAGCTGGCCCAGGGCGCCTA 
CCGCACAGCTGTGGACTTGGAGTCTCTGGCCTCTCAGCTCACAGCAGACCTCCAGGAGGTG 
TCTGGGGACCACCGCTTGCTAGTGTTCCACAGCCCTGGCGAGCTGGTGGTAGAGGAAGCAC 
CCCCACCACCCCCTGCTGTCCCCTCTCCAGAGGAGCTCACCTACCTTATTGAGGCCCTGTTC 
AAGACAGAGGTGCTGCCCGGCCAGCTGGGCTACCTGCGTTTTGACGCCATGGCTGAACTGG 

40 AGACAGTGAAGGCCGTGGGGCCACAGCTGGTGCGGCTGGTATGGCAACAG 

CTGGTGGACACGGCTGCGCTGGTGATCGACCTGCGCTACAACCCTGGCAGCTACTCCACGG 
CCATCCCGCTGCTCTGCTCCTACTTCTTTGAGGCAGAGCCCCGCCAGCACCTGTATTCTGTC 
TITGACAGGGCCACCTCAAAAGTCACGGAGGTGTGGACCTTGCCCCAGGTCGCCGGCCAGC 
GCTACGGCTCACACAAGGACCTCTACATCCTGATGAGCCACACCAGTGGCTCTGCGGCCGA 

45 GGCCTTTGCACACACCATGCAGGACCTGCAGCGGGCCACGGTCATTGGGGAGCCCACGGCC 
GGAGGCGCACTCTCTGTGGGCATCTACCAGGTGGGCAGCAGCCCCTTATATGCATCCATGC 
CCACCCAGATGGCCATGAGTGCCACCACAGGCAAGGCCTGGGACCTGGCTGGTGTGGAGCC 
CGACATCACTGTGCCCATGAGCGAAGCCCTTTCCATAGCCCAGGACATAGTGGCTCTGCGT 
GCCAAGGTGCCCACGGTGCTGCAGACGGCCGGGAAGCTGGTGGCTGATAACTATGCCTCTG 

50 CCGAGCTGGGGGCCAAGATGGCCACCAAACTGAGCGGTCTGCAGAGCCGCTACTCCAGGGT 
GACCTCAGAAGTGGCCCTAGCCGAGATCCTGGGGGCTGACCTGCAGATGCTCTCCGGAGAC 
CCACACCTGAAGGCAGCCCATATCCCTGAGAATGCCAAGGACC GCATT CCTGGAATTGTGC 
CCATGCAGATCCCrrCCCCTGAAGTATrTGAAGAGCTGATCAAGTTTTCCTTCCACACTAAC 
GTGCTTGAGGACAACATTGGCTACTTGAGGTTTGACATGTTTGGGGACGGTGAGCTGCTCA 
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CCCAGGTCTCCAGGCTGCTGGTGGAGCACATCTGGAAGAAGATCATGCACACGGATGCCAT 
GATCATCGACATGAGGTTCAACATCGGTGGCCCCACATCCTCCATTCCCATCTTGTGCTCCT 
AC1TCTTTGATGAAGGCCCTCCAGTTCTGCTGGACAAGATCTACAGCCGGCCTGATGACTCT 
GTCAGTGAACTCTGGACACACGCCCAGGTTGTAGGTGAACGCTATGGCTCCAAGAAGAGCA 
5 TGGTCATTCTGACCAGCAGTGTGACGGCCGGCACCGCGGAGGAGTTCACCTATATCATGAA 
GAGGCTGGGCCGGGCCCTGGTCATTGG 

GGAGGTGACCAGTGGGGGCTGCCAGCCACCACAGACCTACCACGTGGATGACACCAACCTC 

TACCTCACTATCCCCACGGCCCGTTCTGTGGGGGCCTCGGATGGCAGCTCCTGGGAAGGGG 

TGGGGGTGACACCCCATGTGGTTGTCCCTGCAGAAGAGGCTCTCGCCAGGGCCAAGGAGAT 

10 GCTCCAGCACAACCAGCTGAGGGTGAAGCGGAGCCCAGGCCTGCAGGACCACCTGTAGGG 
AAGGGCCCCATAGGCAGAGCCCCAGGGCAGACAGAACCTCTGGGACACACACCAAGGGCA 
CTCCTGCAGGTGGCCCGGCCTGAGGTTCCCAGGAGCAGCAAAGGGGCCTGCTGAGCTCTGG 
TTAGGTTACAGCTGGAGGTGTGTATATATACACACACACACATGTATATACACATATATAT 
GTGTATGTATATATATGTATATATATATGGCTTTCCAATAACCACCTAAATTTTAACAAAGG 

15 TrCCTTCTAAGTGGTAGAACTTGGGGTGGTATTTTTACCTTCCTTCTTCATACrrrGC 

TTCTTAAATACTCATTAATGTGCATATATCATTATTTTCAGATGCAGCTATCATTATTCCAA 
AATACAAAATAA 

SEQ ID N°31> NAME = 'Rcverse-Translalion of Gm2 FRAG' : T>TE = DNA 
20 ATGCARWS^r^^TNATGCARGCNCC^^YT^^VTNATHGC^^/TNGG^^n^ 

GCNCARGCNCAYYTNAARAARCCNWSNCARYTNWSNWSNTTYWSNTGGGAYAAYTGYGAY 
GARGGNAARGAYCCNGCNGTNATHMGNWSNYTNACNYTNGARCCNGAYCCNATHGTNGTN 
CCNGGNAAYGTNACNYTNWSNGTNGTNGGNWSNACNWSNGTNCCNYTNWSNWSNCCNYT 
NAARGTNGAYYTNGTNYTNGARAARGARGTNGCNGGNYTNTGGATHAARATHCCNTGYAC 
25 NGAYTAYATHGGNWSNTGYACNTTYGARCAYTTVTGYGAYGTNYTNGAVATGYTNATHCC 
NACNGGNGARCCNTGYCCNGARCCNYTNMGNACNTAYGGNYTNCCNTGYCAYTGYCCNTT 
YAARGARGGNACNTAYWSNYTNCCNAARWSNGARTTYGTNGTNCCNGAYYTNGARYTNCC 
NWSNTGGYTNACNACNGGNAAYTAYMGNATHGARWSNGTNYTNWSNWSNWSNGGNAARM 
GNYTNGGNTGYATHAARATHGCNGCNWSNYTNAARGGNATH 

30 

SEQ ID N° 32>gi|4587475Igb|AF124717.11HSGM2Al Homo sapiens GM2 aclivaior protein (GM2A) 
gene, exon 1, complete sequence 

rrTCTTTGCGTAACCAATACTGGAAGGCATTTAAAGGACCTCTGCCGCCTCAGACCTTGCAG 
TTAACTCCGCCCTGACCCACCCTTCCCGATGCAGTCCCTGATGCAGGCTCCCCTCCTGATCG 

35 CCCTGGGCTTGCTTCTCGCGACCCCTGCGCAAGCCCACCTGAAAAAGGTGAGTGCACCCTC 
TTTTAAGAGTCTGTTTGCAGCCTCCTGGCCCAGCTACGGGTGTGCGGGTCTGGCTGAGATAT 
GGGGGTGGCCACTCCGTTCTCTAGAATTGGTTCTCTGCACTAGAGCCTTCCAAAGTAACTAA 
TTATGGGATTCTGGTCTGTACAATGAGGGTGGCCTCTAAAGACTTGTTCTGCTCCAGGCCCT 
TTTTGGAGAGATTAATCTCACGTCTGCACTCTCCTGCCCTCCCTCCAAGCGCCGGAGTGAAA 

40 ATGCAGACAGCCTTAAAACTAAGGCATTGCCCCCAAGAGATTCAGTCCTGTTAACCCTGCA 
CCTTACTCCTGACCCCCACTCCTTATGTCCCCCATGATAAGGCCTGCTGCCTCATCTCTTCCC 
CTGCTCGAATGCCCTGAGGTCTTCCTGAGAGTTGGGAGGGTTTGAGAGCTTTCCAAGGCCA 
AGAGGATTCACTAAG 

45 SEQ ID N° 33 >gil4587476jgbJAF124718.1|HSGM2A2 Homo sapiens GM2 activator protein (GM2A) 
gene, cxon 2, complete sequence 

CAGGAGCTTGCCCTCTTGCTGGGATTCCAACGCTGGCTGGAGAGGAGTGGGCAGCAGGGAG 
GTGGGAAGTCAGAGAAGGTGCCCACCAAAGGCCTATTAGGTCAGTCTCCTGTTT GGAAG TT 
CCAGGTCTATCATATCCTGCCTTATAGTTTACAATACACTTTTGGGAGATTATGTCTTTTGA 
50 GTCTTTTAGTTTAGTCCTGCCTATAAAATGAGTAGGATAAGTGTTATCCCAGGTTCATAGGT 
ATGGAGTCTCATAGATGAGGCTCAGGGACGGGGGTGCCTCA CCCAA GGTCACACTGCCAGG 
AGCTCATTITrCCTGTGATCTGTGATAGTTTCTrrrGTCAACCTTTTTCTTCTTCT^ 
GCTGCCTGATTGTCCCCAGCCATCCCAGCTCAGTAGCTTTTCCTGGGATAACTGTGATGAAG 
GGAAGGACCCTGCGGTGATCAGAAGCCTGACTCTGGAGCCTGACCCCATCGTCGTTCCTGG 
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AAATGTGACCCTCAGTGTCGTGGGCAGCACCAGTGTCCCCCTGAGTTCTCCTCTGAAGGTG 
AGCCTGGGGGTGGGTGGAGAAGGGGAGGTGCGAGGGTCTGGCCAGCAGGGGTACTGGGGC 
ATGTATGCrrGGGGAACTGTGAAGAATTTCAGAATCCTGGATTCCCAGAGAATAGTACAGG 
ACATGTAGATTCAGACACTCTTTCACAGGTTCATGGAATCTCAGGATCATAAGATTGAAAG 
5 GAATCTCTGATGTCAGCGCCAGCAACTTCCTGGTGAGGGCAGGAGTGACGGATACCTTGCA 
CCTGGCAGAAGCGTCCTGGCCTTCTCTGGGCCTGGTGGCCAACTGCTCATTATTATCTGACA 
GCTCTGGTTGGCCAATTTGGTTTTGCTGTTAATTATAAAATTGATATACCAATTAGCCAGTA 
ATATATAGTCACTTTAGAAAACACAAGTGGTCAAAAAATAAATAAAATAGGCCAAGTGTGG 
TAACTTCATGCCTGTAATTCCCACACCCTTAGGAGGCTGAAGGTGGGTGGGATCCTTTTTGA 
10 GG 

SEQ ID N° 34>gi|4587477|gb|AF124719.1|HSGM2A3 Homo sapiens GM2 activator proiein (GM2A) 

gene, exons 3 and 4, complete seqvicnce; and complete cds 

ACAGTAGATGCCAGTGCATTTCAATGCAAGTGTTAGAGCCAATCAATGGGTAGTGACTACC 

15 TAAAGAATTTTAAGACTATGGATTGAGCATGATGGCTCACGGCCTGTAATCCCAGCCTTTG 
GAAGGTGAAGGTGAAAGGATTGCTTGAGGCCAGGAGTTCCAGACCAGCTTGGGCAACAAA 
GTGAGCCCCATCTCTACAAAAAATACAAAATTAGCTGGGTGTGGTGGCATGTGCCTGTCTG 
TGTTTCCCACCTACATGGGAGGCTGAGGCAGGAGGATCGTCTGAGCCCAGGAGTTTGAGGC 
TGCAGTGAGTGCAGTGAGCCATGATACAAAAAAAAAAAATAAAGAATTCTAAGTCTATGTA 

20 TAGTTCAGTGTAGGGGGAAAATTCACATTTGATTATTAATGTCTGCCATGGGCACAATAAT 
ACACTATACTCACACATGGGCCACAATGTTGCCATTCCTAGAACAGACTATCTCTAAGATCT 
CATCCAGTTAAAAATTCTATGATTAAAATATATTGCTGCTTTTTTGAAGACAGAAGAGCTGG 
TATGTTTGCCCTGGAATTTACACrrATAACCTTTTTCAAACCTTTGTTTTA I 1 1 I'J ITl i'ACC 
AGGTGGATTTAGTTTTGGAGAAGGAGGTGGCTGGCCTCTGGATCAAGATCCCATGCACAGA 

25 CTACATTGGCAGCTGTACCTTTGAACACTTCTGTGATGTGCTTGACATGTTAATTCCTACTG 
GGGAGCCCTGCCCAGAGCCCCTGCGTACCTATGGGCTTCCTTGCCACTGTCCCTTCAAAGA 
AGTAAGTACTTAGGGAGGAGAGAGCGTTACCCCTGTGGCTAAAGAGATGGGGTTTGGAGA 
GAAGGGTCTTTGCATTCTCCTTCTGCAGATCTGCATGTCTCTGGATTTGTAAGCCAGTGTGA 
CCTATCAGGAATCACTTATCTTCCGGGAGCCTCAGTTATCCATCTACGAAATGGGAGACTTG 

30 AACTTAGATGTGATCTTCAGGGCCCTTTATCCATATAATCCATGCTCTACAGTGCTATGGCC 
GTCTCTCATCTTGTGCGGCTGTTTTGAGAATGGGAAGAGGGGTGGTAGTTCATGGCTGCAA 
TCCTAGCAGTGGCTCTAGGAGAAAGACCCCATCAGTAGGCTCCCACTGACTGGCGGTCCAC 
TGGCTTTCCCGCAGGGAACCTACTCACTGCCCAAGAGCGAATTCGTTGTGCCTGACCTGGA 
GCTGCCCAGTTGGCTCACCACCGGGAACTACCGCATAGAGAGCGTCCTGAGCAGCAGTGGG 

35 AAGCGTCTGGGCTGCATCAAGATCGCTGCCTCTCTAAAGGGCATATAGCATGGCATCTGCC 
ACAGCAGAATGGAGCGGTGTGAGGAAGGTCCCTTTTCCTCTGTTTTGTGTTTGCCAAGGCC 
AAACTCCCACTCTCTGCCCCCCTTTAATCCCCTTTCTACAGTGAGTCCACTACCCTCACTGA 
AAATCATTTTGTACCACTrACATTTTAGGCTGGGGCAAGCAGCCCTGACCTAAGGGAGAAT 
GAGTTGGACAGTTCTTGATAGCCCAGGGCATCTGCTGGGCTGACCACGTTACTCATCCCCGT 

40 TAACATrCTCTCTAAAGAGCCTCGTTCATTTCCAAAGCAGTTAAGGAATGGGAACAGAGTG 
TirrAGGACCTGAAGAATCTTTATGACTCTCTCTCriTCTCTC rri l^MM - l 

SEQ ID 35>gi|4587475|gb|AF1247l7. IIHSGM2A1 Homo sapiens GM2 activator protein (GM2A) 
gene, exon 1, complete sequence 

45 TTTCTTTGCGTAACCAATACTGGAAGGCATTTAAAGGACCTCTGCCGCCTCAGACCTTGCAG 
TTAACTCCGCCCTGACCCACCCTTCCCGATGCAGTCCCTGATGCAGGCTCCCCTCCTGATCG 
CCCTGGGCTTGCTTCTCGCGACCCCTGCGCAAGCCCACCTGAAAAAGGTGAGTGCACCCTC 
TTTTAAGAGTCTGTTTGCAGCCTCCTGGCCCAGCTACGGGTGTGCGGGTCTGGCTGAGATAT 
GGGGGTGGCCACTCCGTTCTCTAGAATTGGTrCTCTGCACTAGAGCCTTCCAAAGTAACTAA 

50 TTATGGGATTCTGGTCTGTACAATGAGGGTGGCCTCTAAAGACTTGTTCTGCTCCAGGCCCT 
TTTTGGAGAGATTAATCTCACGTCTGCACTCTCCTGCCCTCCCTCCAAGCGCCGGAGTGAAA 
ATGCAGACAGCCTTAAAACTAAGGCATTGCCCCCAAGAGATTCAGTCCTGTTAACCCTGCA 
CCTTACTCCTGACCCCCACrCCTTATGTCCCCCATGATAAGGCCTGCTGCCTCATCTCTTCCC 
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CTGCTCGAATGCCCTGAGGTCTTCCTGAGAGTTGGGAGGGTTTGAGAGCTTTCCAAGGCCA 
AGAGGATTCACTAAG 

SEQ ID N'* 36>gi|45874761gb|AFl24718JjHSGM2A2 Homo sapiens GM2 aclivator protein (GM2A) 
5 gene, exon 2, complete sequence 

CAGGAGCTTGCCCTCTTGCTGGGATTCCAACGCTGGCTGGAGAGGAGTGGGCAGCAGGGAG 
GTGGGAAGTCAGAGAAGGTGCCCACCAAAGGCCTATTAGGTCAGTCTCCTGTTTGGAAGTT 
CCAGGTCTATCATATCCTGCCTTATAGTTTACAATACACTTTTGGGAGATTATGTCTTTTGA 
GTCTTTTAGTTTAGTCCTGCCTATAAAATGAGTAGGATAAGTGTTATCCCAGGTTCATAGGT 

10 ATGGAGTCTCATAGATGAGGCTCAGGGACGGGGGTGCCTCACCCAAGGTCACACTGCCAGG 
AGCTCATTTTTCCTGTGATCTGTGATAGTTTCTTTTGTCAACCTTTTTCT^^ 
GCTGCCTGATTGTCCCCAGCCATCCCAGCTCAGTAGCTTTTCCTGGGATAACTGTGATGAAG 
GGAAGGACCCTGCGGTGATCAGAAGCCTGACTCTGGAGCCTGACCCCATCGTCGTTCCTGG 
AAATGTGACCCTCAGTGTCGTGGGCAGCACCAGTGTCCCCCTGAGTTCTCCTCTGAAGGTG 

15 AGCCTGGGGGTGGGTGGAGAAGGGGAGGTGCGAGGGTCTGGCCAGCAGGGGTACTGGGGC 
ATGTATGCTTGGGGAACTGTGAAGAATTTCAGAATCCTGGATTCCCAGAGAATAGTACAGG 
ACATGTAGATTCAGACACTCTTTCACAGGTTCATGGAATCTCAGGATCATAAGATTGAAAG 
GAATCTCTGATGTCAGCGCCAGCAACTTCCTGGTGAGGGCAGGAGTGACGGATACCTTGCA 
CCTGGCAGAAGCGTCCTGGCCTTCTCTGGGCCTGGTGGCCAACTGCTCATTATTATCTGACA 

20 GCTCTGGTTGGCCAATTTGGTTTTGCTGTTAATTATAAAATTGATATACCAATTAGCCAGTA 
ATATATAGTCACTTTAGAAAACACAAGTGGTCAAAAAATAAATAAAATAGGCCAAGTGTGG 
TAACrrCATGCCTGTAATTCCCACACCCTTAGGAGGCTGAAGGTGGGTGGGATCCTTTTTGA 
GG 

25 SEQ ID N° 37>gi}4587477|gbIAFJ247I9J|HSGM2A3 Homo sapiens GM2 activator protein (GM2A) 
gene, exons 3 and 4, complete sequence; and complete cds 

ACAGTAGATGCCAGTGCATTTCAATGCAAGTGTTAGAGCCAATCAATGGGTAGTGACTACC 

TAAAGAATTTTAAGACTATGGATTGAGCATGATGGCTCACGGCCTGTAATCCCAGCCTTTG 

GAAGGTGAAGGTGAAAGGATTGCTTGAGGCCAGGAGTTCCAGACCAGCTTGGGCAACAAA 

30 GTGAGCCCCATCTCTACAAAAAATACAAAATTAGCTGGGTGTGGTGGCATGTGCCTGTCTG 
TGTTTCCCACCTACATGGGAGGCTGAGGCAGGAGGATCGTCTGAGCCCAGGAGTTTGAGGC 
TGCAGTGAGTGCAGTGAGCCATGATACAAAAAAAAAAAATAAAGAATTCTAAGTCTATGTA 
TAGTTCAGTGTAGGGGGAAAATTCACATTTGATTATTAATGTCTGCCATGGGCACAATAAT 
ACACTATACTCACACATGGGCCACAATGTTGCCATTCCTAGAACAGACTATCTCTAAGATCT 

35 CATCCAGTTAAAAATTCTATGATTAAAATATATTGCTGCTTTTTTGAAGACAGAAGAGCTGG 
TATGTTTGCCCTGGAATTTACACnTATAACCTTTTTCAAACCTTTGTTT^ 1111111 1 ACC 
AGGTGGATTTAGTTTTGGAGAAGGAGGTGGCTGGCCTCTGGATCAAGATCCCATGCACAGA 
CTACATTGGCAGCTGTACCTTTGAACACTTCTGTGATGTGCTTGACATGTTAATTCCTACTG 
GGGAGCCCTGCCCAGAGCCCCTGCGTACCTATGGGCTTCCTTGCCACTGTCCCTTCAAAGA 

40 AGTAAGTACTTAGGGAGGAGAGAGCGTTACCCCTGTGGCTAAAGAGATGGGGTTTGGAGA 
GAAGGGTCTTTGCATTCTCCTTCTGCAGATCTGCATGTCTCTGGATTTGTAAGCCAGTGTGA 
CCTATCAGGAATCACTTATCTTCCGGGAGCCTCAGTTATCCATCTACGAAATGGGAGACTTG 
AACTTAGATGTGATCTTCAGGGCCCTTTATCCATATAATCCATGCTCTACAGTGCTATGGCC 
GTCTCTCATCTTGTGCGGCTGTTTTGAGAATGGGAAGAGGGGTGGTAGTTCATGGCTGCAA 

45 TCCTAGCAGTGGCTCTAGGAGAAAGACCCCATCAGTAGGCTCCCACTGACTGGCGGTCCAC 
TGGCTTTCCCGCAGGGAACCTACTCACTGCCCAAGAGCGAATTCGTTGTGCCTGACCTGGA 
GCTGCCCAGTTGGCTCACCACCGGGAACTACCGCATAGAGAGCGTCCTGAGCAGCAGTGGG 
AAGCGTCTGGGCTGCATCAAGATCGCTGCCTCTCTAAAGGGCATATAGCATGGCATCTGCC 
ACAGCAGAATGGAGCGGTGTGAGGAAGGTCCCTTTTCCTCTGTTTTGTGTTTGCCAAGGCC 

50 AAACTCCCACTCTCTGCCCCCCTTTAATCCCCTTTCTACAGTGAGTCCACTACCCTCACTGA 
AAATCATTTTGTACCACTTACATTTTAGGCTGGGGCAAGCAGCCCTGACCTAAGGGAGAAT 
GAGTTGGACAGTTCTTGATAGCCCAGGGCATCTGCTGGGCTGACCACGTTACTCATCCCCGT 
TAACATTCTCTCTAAAGAGCCTCGTTCATTTCCAAAGCAGTT AAGGAATG GGAACAGAGTG 
TTTTAGG ACCTG A AG A ATCTTTATG ACTCTCTCTCnrCTCTC! ' 1' l' 1" 1" 11 J 
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SEQ ID N° 38>gil4504028|reflNM_0OO405.I|GM2Ai Homo sapiens GM2 gangJioside activator 
protein (GM2A) mRNA 

TTTCTTTGCGTAACCAATACTGGAAGGCATTTAAAGGACCTCTGCCGCCTCAGACCTTGCAG 
5 TTAACTCCGCCCTGACCCACCCTTCCCGATGCAGTCCCTGATGCAGGCTCCCCTCCTGATCG 
CCCT GGGC TTGCTTCTCGCGACCCCTGCGCAAGCCCACCTGAAAAAGCCATCCCAGCTCAG 
TAGCTTTTCCTGGGATAACTGTGATGAAGGGAAGGACCCTGCGGTGATCAGAAGCCTGACT 
CTGGAGCCTGACCCCATCGTCGTTCCTGGAAATGTGACCCTCAGTGTCGTGGGCAGCACCA 
GTGTCCCCCTGAGTTCrCCrCTGAAGGTGGATTTAGTTTTGGAGAAGGAGGTGGCTGGCCTC 

10 TGGATCAAGATCCCATGCACAGACTACATTGGCAGCTGTACCTTTGAACACTTCTGTGATGT 
GCTTGACATGTTAATTCCTACTGGGGAGCCCTGCCCAGAGCCCCTGCGTACCTATGGGCTTC 
CTTGCCACTGTCCCTTCAAAGAAGGAACCTACTCACTGCCCAAGAGCGAATTCGTTGTGCCT 
GACCTGGAGCTGCCCAGTTGGCTCACCACCGGGAACTACCGCATAGAGAGCGTCCTGAGCA 
GCAGTGGGAAGCGTCTGGGCTGCATCAAGATCGCTGCCTCTCTAAAGGGCATATAGCATGG 

15 CATCTGCCACAGCAGAATGGAGCGGTGTGAGGAAGGTCCCTTTTCCTCTGTTTTGTGTTTGC 
CAAGGCCAAACTCCCACTCTCTGCCCCCCTTTAATCCCCTTTCTACAGTGAGTCCACTACCC 
TCACTGAAAATCATTTTGTACCACnTACATTTTAGGCTGGGGCAAGCAGCCCTGACCTAAG 
GGAGAATGAGTTGGACAGTTCTTGATAGCCCAGGGCATCTGCTGGGCTGACCACGTTACTC 
ATCCCCGTTAACATTCTCTCTAAAGAGCCTCGTTCATTTCCAAAGCAGTTAAGGAATGGGA 

20 ACAGAGTGTTTTAGGACCTGAAGAATCTTTATGACTCTCTCTCrrrCTCT Cl 1111111 

SEQ ID 39>giI4587476|gb|AFI24718.1|HSGM2A2 Homo sapiens GM2 activator protein (GM2A) 
gene, exon 2, complete sequence 

CAGGAGCTTGCCCTCTTGCTGGGATTCCAACGCTGGCTGGAGAGGAGTGGGCAGCAGGGAG 

25 GTGGGAAGTCAGAGAAGGTGCCCACCAAAGGCCTATTAGGTCAGTCTCCTGTTTGGAAGTT 
CCAGGTCTATCATATCCTGCCTTATAGTTTACAATACACTTTTGGGAGATTATGTCTTTTGA 
GTCTTTTAGTTTAGTCCTGCCTATAAAATGAGTAGGATAAGTGTTATCCCAGGTTCATAGGT 
ATGGAGTCTCATAGATGAGGCTCAGGGACGGGGGTGCCTCACCCAAGGTCACACTGCCAGG 
AGCTCATTTTTCCTGTGATCTGTGATAGTTTCTTTTGTCAACCTTTTTC^ 

30 GCTGCCTGATTGTCCCCAGCCATCCCAGCTCAGTAGCTTTTCCTGGGATAACTGTGATGAAG 
GGAAGGACCCTGCGGTGATCAGAAGCCTGACTCTGGAGCCTGACCCCATCGTCGTTCCTGG 
AAATGTGACCCTCAGTGTCGTGGGCAGCACCAGTGTCCCCCTGAGTTCTCCTCTGAAGGTG 
AGCCTGGGGGTGGGTGGAGAAGGGGAGGTGCGAGGGTCTGGCCAGCAGGGGTACTGGGGC 
ATGTATGCTTGGGGAACTGTGAAGAATTTCAGAATCCTGGATTCCCAGAGAATAGTACAGG 

35 ACATGTAGATTCAGACACTCTTTCACAGGTTCATGGAATCTCAGGATCATAAGATTGAAAG 
GAATCTCTGATGTCAGCGCCAGCAACTTCCTGGTGAGGGCAGGAGTGACGGATACCTTGCA 
CCTGGCAGAAGCGTCCTGGCCTTCTCTGGGCCTGGTGGCCAACTGCTCATTATTATCTGACA 
GCTCTGGTTGGCCAATITGGTTTTGCTGTTAATTATAAAATTGATATACCAATTAGCCAGTA 
ATATATAGTCACTTTAGAAAACACAAGTGGTCAAAAAATAAATAAAATAGGCCAAGTGTGG 

40 TAACTTCATGCCTGTAATTCCCACACCCTTAGGAGGCTGAAGGTGGGTGGGATCCTTTTTGA 
GG 

SEQ ID N° 40 >gi|4587477|gb|AF124719. 1|HSGM2A3 Homo sapiens GM2 activator protein (GM2A) 
gene, exons 3 and 4, complete sequence; and complete cds 

45 ACAGTAGATGCCAGTGATTTCAATGCAAGTGTTAGAGCCAATCAATGGGTAGTGACTACCT 
AAAGAATTITAAGACTATGGATTGAGCATGATGGCTCACGGCCTGTAATCCCAGCCTTTGG 
AAGGTGAAGGTGAAAGGATTGCTTGAGGCCAGGAGTTCCAGACCAGCTTGGGCAACAAAG 
TGAGCCCCATCTCTACAAAAAATACAAAATTAGCTGGGTGTGGTGGCATGTGCCTGTCTGT 
GTTTCCCACCTACATGGGAGGCTGAGGCAGGAGGATCGTCTGAGCCCAGGAGTTTGAGGCT 

50 GCAGTGAGTGCAGTGAGCCATGATACAAAAAAAAAAAATAAAGAATTCTAAGTCTATGTAT 
AGTTCAGTGTAGGGGGAAAATTCACATTTGATTATTAATGTCTGCCATGGGCACAATAATA 
CACTATACTCACACATGGGCCACAATGTTGCCATTCCTAGAACAGACTATCTCTAAGATCTC 
ATCCAGTTAAAAATTCTATGATTAAAATATATTGCTGCTTTTTTGAAGACAGAAGAGCTGGT 
ATGTirGCCCTGGAATTTACACTTATAACCTTTTTCAAACCTTTGTTTTA'rr^ 
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GGTGGATTTAGTTTTGGAGAAGGAGGTGGCTGGCCTCTGGATCAAGATCCCATGCACAGAC 

TACATTGGCAGCTGTACCTTTGAACACTTCTGTGATGTGCTTGACATGTTAATTCCTACTGG 

GGAGCCCTGCCCAGAGCCCCTGCGTACCTATGGGCTTCCTTGCCACTGTCCCTTCAAAGAA 

GTAAGTACTTAGGGAGGAGAGAGCGTTACCCCTGTGGCTAAAGAGATGGGGTTTGGAGAG 

AAGGGTCTTTGCATTCTCCTTCTGCAGATCTGCATGTCTCTGGATTTGTAAGCCAGTGTGAC 

CTATCAGGAATCACTTATCTTCCGGGAGCCTCAGTTATCCATCTACGAAATGGGAGACTTG 

AACTTAGATGTGATCTTCAGGGCCCTTTATCCATATAATCCATGCTCTACAGTGCTATGGCC 

GTCTCTCATCTTGTGCGGCTGTTTTGAGAATGGGAAGAGGGGTGGTAGTTCATGGCTGCAA 

TCCTAGCAGTGGCTCTAGGAGAAAGACCCCATCAGTAGGCTCCCACTGACTGGCGGTCCAC 

TGGCTTTCCCGCAGGGAACCTACTCACTGCCCAAGAGCGAATTCGTTGTGCCTGACCTGGA 

GCTGCCCAGTTGGCTCACCACCGGGAACTACCGCATAGAGAGCGTCCTGAGCAGCAGTGGG 

AAGCGTCTGGGCTGCATCAAGATCGCTGCCTCTCTAAAGGGCATATAGCATGGCATCTGCC 

ACAGCAGAATGGAGCGGTGTGAGGAAGGTCCCTTTTCCTCTGTTTTGTGTTTGCCAAGGCC 

AAACTCCCACTCTCTGCCCCCCTTTAATCCCCTTTCTACAGTGAGTCCACTACCCTCACTGA 

AAATCATTTTGTACCACTTACATTTTAGGCTGGGGCAAGCAGCCCTGACCTAAGGGAGAAT 

GAGTTGGACAGTTCTTGATAGCCCAGGGCATCTGCTGGGCTGACCACGTTACTCATCCCCGT 

TAACATTCTCTCTAAAGAGCCTCGTTCATTTCCAAAGCAGTT AAGGAATG GGAACAGAGTG 

TTTT AGG ACCTG A AG A ATCTTTATG ACTCTCTCTCTTTCTCTC 1' 1 " 11 " 11 " H 

SEQ ID 41 >gi|4504028jrcnNM_000405. 1IGM2AI Homo sapiens GM2 ganglioside activator 
protein {GM2A) niRNA 

TTTCTTTGCGTAACCAATACTGGAAGGCATTTAAAGGACCTCTGCCGCCTCAGACCTTGCAG 

TTAACTCCGCCCTGACCCACCCTTCCCGATGCAGTCCCTGATGCAGGCTCCCCTCCTGATCG 

CCCTGGGCTTGCTTCTCGCGACCCCTGCGCAAGCCCACCTGAAAAAGCCATCCCAGCTCAG 

TAGCTTTTCCTGGGATAACTGTGATGAAGGGAAGGACCCTGCGGTGATCAGAAGCCTGACT 

CTGGAGCCTGACCCCATCGTCGTTCCTGGAAATGTGACCCTCAGTGTCGTGGGCAGCACCA 

GTGTCCCCCTGAGTTCTCCTCTGAAGGTGGATTTAGTrTTGGAGAAGGAGGTGGCTGGCCTC 

TGGATCAAGATCCCATGCACAGACTACATTGGCAGCTGTACCTTTGAACACTTCTGTGATGT 

GCTTGACATGTTAATTCCTACTGGGGAGCCCTGCCCAGAGCCCCTGCGTACCTATGGGCTTC 

CTTGCCACTGTCCCTTCAAAGAAGGAACCTACTCACTGCCCAAGAGCGAATTCGTTGTGCCT 

GACCTGGAGCTGCCCAGTTGGCTCACCACCGGGAACTACCGCATAGAGAGCGTCCTGAGCA 

GCAGTGGGAAGCGTCTGGGCTGCATCAAGATCGCTGCCTC TCTAA AGGG CATAT AGCATGG 

CATCTGCCACAGCAGAATGGAGCGGTGTGAGGAAGGTCCCTTTTCCTCTGTTTTGTGTTTGC 

CAAGGCCAAACTCCCACTCTCTGCCCCCCTTTAATCCCCTTTCTACAGTGAGTCCACTACCC 

TCACTGAAAATCATTTTGTACCA(nTACATTTTAGGCTGGGGCAAGCAGCCCTGACCTAAG 

GGAGAATGAGTrGGACAGTTCTTGATAGCCCAGGGCATCTGCTGGGCTGACCACGTTACTC 

ATCCCCGTTAACATTCTCTCTAAAGAGCCTCGTTCATTTCCAAAGCAGTT AAGGAATG GGA 

ACAGAGTGTTrTAGGACCTGAAGAATCTTTATGACTCTCTCTCTTTCTCTCl 1 i i 1 1 1 1 

SEQ ID N°42 > NAME = 'Reverse-Translaiion ofCALB FRE' : TYPE = DNA 

ATGACNTGYAARATGWSNCARYTNGARMGNAAYATHGARACNATHATHAAYACNTTYCAY 

CARTAYWSNGTNAARYTNGGNCAYCCNGAYACNYTNAAYCARGGNGARTTYAARGARYTN 

GTNMGNAARGAYYTNCARAAYTTYYTNAARAARGARAAYAARAAYGARAARGTNATHGAR 

CAYATHATGGARGAYYTNGAYACNAAYGCNGAYAARCARYTNWShTITYGARGARTTYATH 

ATGYTNATGGCNMGNYTNACNTGGGCNWSNCAYGARAARATGCAYGARGGNGAYGARGG 

NCCNGGNCAYCAYCAYAARCCNGGNYTNGGNGARGGNACNCCN 

SEQ ID N° 43>gi|188691|gb|M21005J|HUMMRP8A Human migration inhibitory factor-related 

protein 8 (MRP8) gene, complete cds 

TTCCACCTTTTGGCTCTTGTAAATAATGCTGCTATGAACATGAATGTACAAACATCTGTTTG 

AATCCCTGCATTCAATTCTTTTGCATATATACCCAGGAGCAGAATGATGGATCAT ATGGT AA 

TTCTGTGTTTATTTArrTGAGGAACAAACTTGCCGTTTTCCATAACAGCTGCACT ATTT^ 

ATTCCCACTAACAGTGCATTAGGCTTCCAATTCTCTATGCCCTCACCAACACTTGT TTTCT G 

GGTTrrAAAAGAAGTAGTAGTCATCCTTGTAGGTGTCAGGTGGTATCTCATTGTCGTTTTGC 
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TTCATGTTTTCCTAAAGATTAGTAATTTTCATATGCTTATTGACCATTTGTATATCTTCTTCG 
GAGAAGTGTC TATTT GAGTCTTTCCCCAATTTTGATTGGTTTGTTTGTTTT^ 
TGTAGGGATTCTTTTATATTCTGGATATTAATCCCITATCAGATATTTGTTTTACAAATAT^ 
TCTTTGTAACAACAGAAACACACCACAGTCTTCAAGGTTGGAAGCCAGTTAATCTGAGTAG 
5 CATTTTGTTAGTGGTGGGGAGAGGATTTGTTCCTCCTGAAATCCTGGGGAATTGGCCACCTC 
CTCTTCTCCTCTTAGGCATGAAGCGCGTCTGGCTTCTCCAAAGAACTCTTCCCCTCCACTAC 
CTCAGAGTTAGCTTCCTCTCTTCAGCCAGTGATCCTGGGGTCCCAGACACAATAATTAACCA 
AGAGAGGGTGAAAGGCTCCCTGCTGTGTTTATGCAATGGCTCAGGCCCTTGTGAAGTGCCG 
AGGGACCCCAAGCAGCCTCCATCTCCCAGGGCATGGTCCATCCCCAGCTTTCACAGAACAG 
10 GAAAGCTGTGGAGGAGTGTGGGCAGCAGGGTAGGAATGGATATAGCCCTTGGCAACAACA 
CATTTCCCCACAAAGCACCCACCCAAAAGAACAACAACGATAGTTTTAGTTTTTAGTAATG 
AGAACAATAGTTCTCATGACTAAAAGCCATCAGCCAGGACACTGTTCTCAACCCTTTTGCG 
GTCTTTGGACCCTTTGAAACTCTGACAGAAGCCATGGAGGAATGTTCTCACTGAGTGCATG 
CACTCAAAATGATGCATTCAACrrCAATTCAGrrTCAGGGATGTATGGCCTGACCACCAAT 
15 GCAGGGGATTAGCAATCGCAATAGTGGAGAGGGCATGGGAGTGGGAATCTGGCTGGATCA 
AGCAAGTGGATGCCAGCAGCCCAGAAAAAGAGCCCCCCTACCTGCTTTTTCCTTCCTGGGC 
ACTATTGCCCAGCAAATGCCTTCCTCTTTCCGCTTCTCCTACCTCCCCACCCAAAATTTTCAT 
TCTGCACAGTGATTGCCACATTCACTGGTTGAGAAACAGAGACTGTAGCAACTCTGGCAGG 
GAGAAGCTGTCTCTGATGGCCTGAAGCTGTGGGCAGCTGGCCAAGCCTAACCGCTATAAAA 
20 AGGAGCTGCCTCTCAGCCCTGCATGTCTCTTGTCAGCTGTCTTTCAGAAGACCTGGTAAGTG 
GGACTGTCTGGGTTGGCCCCGCACTTTGGGCTTCTCTTGGGGAGGGTCAGGGAAGTGGAGC 
AGCCTTCCTGAGAGAGGAGAGAGAAAGCTCAGGGAGGTCTGGAGCAAAGATACTCCTGGA 
GGTGGGGAGTGAGGCAGGGATAAGGAAGGAGAGTATCCTCCAGCACCTTCCAGTGGGTAA 
GGGCACATTGTCTCCTAGGCTGGACTTTTCTTGAGCAGAGGGTGGGGTGGTAAGGAAAGTC 
25 TACGGGCCCCCGTGTGTGTGCACATGTCTCTGTGTGAATGGACCCTTCCCCTTCCCACACGT 
GTATCCCTATCATCCCACCCTTCCCACCAGAGGCCATAGCCATCTGCTGGTTTGGTTATTTG 
AGAGTGCAGGCCAGGACAAGGCCATCGCTTGGGGCATGAATCCTCTGCGTACTGCCCTGGC 
CAGATGCAAATTCCCTGCCATGGGATTCCCCAGAAGGTTCTGTTTTTCAGGTGGGGCAAGTT 
CCGTGGGCATCATGTTGACCGAGCTGGAGAAAGCCTTGAACTCTATCATCGACGTCTACCA 
30 CAAGTACTCCCTGATAAAGGGGAATTTCCATGCCGTCTACAGGGATGACCTGAAGAAATTG 
CTAGAGACCGAGTGTCCTCAGTATATCAGGGTGAGGAGGGGCTGGGTGTGGCGGGGGCTCT 
CTGCCTGGTCCTGGGGCTGCCCTGGGCCAGCGGTCCTCCCTGCCACCCTTCATAGATGCTAT 
GCCTCGGCTCTCTCTGAGATCTTTAAACTCTGGCTTCTTCCTCCTCAATCTTGACAGAAAAA 
GGGTGCAGACGTCTGGTTCAAAGAGTTGGATATCAACACTGATGGTGCAGTTAACTTCCAG 
35 GAGTTCCTCATTCTGGTGATAAAGATGGGCGTGGCAGCCCACAAAAAAAGCCATGAAGAA 
AGCCACAAAGAGTAGCTGAGTTACTGGGCCCAGAGGCTGGGCCCCTGGACATGTACCTGCA 
GAATAATAAAGTCATCAATACCTCATGCCTCTCTCTTATGCTTTTGTGGAATGAGGTTCCTC 
GGTGTGGAGGGAGGGTTGGAAAACCCAAAGGAAGAAAAAGAAATCTATGTTATCCCACCC 
TACCTCTCACAAGCCTTTCCTGCTTTACCCCTCACCTGGCCTCTGCCCCACATTCCTTCAGCC 
40 CCrC ATTT CGAGCATTGGATTTGAGGCTTAAGGATTCAAAAAGTCGTCATGAATATAGCTG 
ATGATTTTATAGTGGTTCTGAAATGGGTCGGGGATTTGGGAACAGGGTGGTAGTATAAGAA 
CAACTGATACTGTTCTCTAAGCTAAATCTTAGCTTCCAGCTACCTGTCTTAGATGTGGCTCT 
TGGGAACCTTAGAGTGATAGCTACATAGAAGTGTGTGGGTGTGTGTGTGTGTGTCTGTGTG 
TGTGTGTGTGAGAGAGAGACAGACAGAAAGAGAGCAAGAGAGGGAAGGGGGGAGAGGCT 
45 GATTGTGTGTGTGGTGTGATGTAGGTGGACAATGTTCAGAGTCCTCCATTAACAGGATAAT 
CCTCACACCTGTCCACATACCTGTAGTTTGTCCTTGGGGATTTTGAAAATTTTTCCTCCCTCT 
CCACTCCCAAACTCCCAACTCAATTAAATGATAAAGGAATAGGCAAATAGGAAAATAAATT 
AGTAAAACTTAAGTCAAAGAATAGGTTATTCATACGCTGCCTATGGGATTCTATGCTTTGTG 
ATCAGAAAATTATCTAAAAAATACTTCCCAAGGGCTGGTACAAGGGAGGCCAGAAGACGA 
50 GTGGTTCTTCTCTGAGGTGGACATTAAAAAAAGAAGAAAATGAAGGGGAACCTTTTGACAA 
GAATGTCACCCCAAACTGGATTTTCATGCTGTGGTGTGGGGAATTTTCTGTTGTCCTCACTT 
AGGTGCTGGGGCAGTGGTGTTAGTGATGGGTAAAAAGGTAGGAAGCTGTCACAGAATCACT 
A AACCA GGGTTCTTAACTTGTCTGTCTATACATCTCTGAAATTGGGTTGAAGTTGTGTGCAT 
CATTTTGAGTGACGCACTGAGAACATTCCTCCACGGCTTCCATCGAGAGTCTCGAAAAGGC 
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CCAACACCTCAAAAAGGTTAAGAACACTTGTCCTGCTTACTGGTTTTTAGTAACAAATGGC 
AGAGTATTTCTCTCTGTCTCTCTCTCri l"l 1 11 1 1 I'l ri"n"n"lTGAGACACAGGGTCTTGTCT 
GTCACGTGGACTAGAGTACAATGGGCATGATCATGGGCTCACTGTAGCCTCGAACACCTGG 
GCTCAAGTAATCCTCCCACCTCAGCCTCTTTAGTAGCTGGGACTACAGCATGAGCCACTGCC 
5 CTTGGCTAATTTTTAAATTATTTTTTTGTAGAGATGGAAACTTGCTATGTTGCCCAGGCTAG 
TCTCAAACTCCTGGACTCAAGCGATCCTCCTACCTTGGCCTCCCAAAGTGCTGAGATTACAG 
TGTGATCCACACCACACCTGGCCAAAGATTGGAGTATTTTTATTGCTATTGTTGTGCTGGGT 
GGGTGGGTGGGTGTATGCTTTGTGGGGACGTGTGTTGTTGCCAAGGGCTAAATCAGTTCCT 
ACCCTGCTGCCCACAGTCCTCCACAGCTTTCCTGCTCTGTGAAGCTAAGGATACACCCCGAT 
10 GATAAGCTGTCAACATA 

SEQ ID N° 44 >gi|4258693|gb|AI4 15 189.1|AI415189 mc07e05.xl Scares mouse p3NMF19.5 Mus 
nmsculus cDNA clone IMAGE:347840 3' similar to gb:X06233 CALGRANULIN B (HUMAN); 
gb:M83219 Mus musculus iniraceliular calcium-binding protein (MOUSE);, niRNA 
15 sequence 

rrrri i ' l I TTrn'rriMTGGATAAAGACTTATTTATTATTTATCTTATCATTTCCCAGAACAA 
AGGCCATTGAGTAAGCCATTCCCTTTAAACTTGGTTGGGCAGCTGTCACATGGCTGACCTCT 
TAATTACTTCCCACAGCCTTTGCCATGACTGTGGCCATGCCCACGTGGGTTGTTCTCATGCA 
GCTrCTCATGACAGGCAAAGATCAACriTGCCATCAGCATCATACACTCCTCAAAGCTCAG 
20 CTGATTGTCCrrGGTTTGTGTCCAGGTCCTCCATGATGTCATTTATGAGGGCriTCATTTCTCTT 
CTCTTTCTTCATAAAAGGTTGCCAAACTGTGCTTCCCACCATTTGGTCTGAATTCCTTCTTGC 
TCAGGGTGTAGGGGNGGGTCTTCCTTCTTAAAGTATTGATGAAAGGGGGCCAGATGGGGGG 
GTTATGCTGCGCTCCATCTGAAAAGTGGCTTTGGTGGGCCAT 

25 SEQlDN*'45clonerMAGE:I96I52I 3' similar to gb:X06233 CALGRANULIN B CHUMAN);.itiRNA 
sequence 

I'n'ri'ri ri 1 1 1 rrrrri'rrri'rrGGAGGAAGAGACTTTATTTGGCCCCAGCcccTAGCCCCA 
cagccaagacagtttgacataacaggccccggggccctggttgggtagaggcagggtggc 
ctggcctcctgattagtggctgtggccgtggccaccatgactgtggccgtggccggggcca 
30 crrgtgatcttggccactgtggtcttagggggtgccctccccgaggcctggcttatggtggtg 
gccagggccctcgtcaccctcgtgcattttttcgtgggaggcccaggttagcctcgccatca 
gcatgatgaactcctggagctcagctgcttgtctgcatttgggtccaggtcctccatgatgt 
gttctatgaccttttcattcitattcrrccttcttga 

35 SEQ ID N° 46 >gi|4437201|gb|AI523066.1!AI523066 ar68a07.xl Barstead aorta HPLRB6 Homo 
sapiens cDNA clone IMAGE:2 127732 3' similar to gb:X06233 CALGRANULIN B 
(HUMAN);, mRNA sequence 

GGAGGAAGAGACTTTATrrGGCCCCAGCCCCTATCCCCACAGCCAAGACAGTTTGACATAA 
CAGGCCCCGGGGCCCTGGTTGGGTAAAGGCAGGGTGGCCTGGCCTCCTGATTAGTGGCTGT 
40 GGCCGTGGCCACCATGACTGTGGCCGTGGCCGTGGCCACTGTGATCTTGGCCACTGTGGTC 
TTAGGGGGTGCCCTCCCCGAGGCCTGGCTTATGGTGGTGGCCAGGGCCCTCGTCACCCTCG 
TGCATCTTCrrCGTGGGAGGCCCAGGTTAGCCTCGCCATCAGCATGATGAACTCCTCGAAGC 
TCAGCTGCrrrGTCTGCATTTGTGTCCAGGTCCrCCATGATGTGTTCTATGACCTTTTCATTCT 
TATTCrCCTTCTTGAGAAAATTTTGCAGATCTTTTCGCACCAGCn'CTTNGAATTCCC 

45 

SEQ ID N" 47 >gi|4506772|renNM_O02965.1lSl00A9| Homo sapiens SlOO calcium-binding protein 
A9 (calgranulin B) (S10OA9) mRNA 

AATTCGCTCGGCTTTGACAGAGTGCAAGACGATGACTTGCAAAATGTCGCAGCTGGAACGC 
AACATAGAGACCATCATCAACACCTTCCACCAATACTCTGTGAAGCTGGGGCACCCAGACA 
50 CCCTGAACCAGGGGGAATTCAAAGAGCTGGTGCGAAAAGATCTGCAAAATnrCTCAAGAA 
GGAGAATAAGAATGAAAAGGTCATAGAACACATCATGGAGGACCTGGACACAAATGCAGA 
CAAGCAGCrrGAGCTTCGAGGAGTTCATCATGCTGATGGCGAGGCTAACCTGGGCCTCCCAC 
GAGAAGATGCACGAGGGTGACGAGGGCCCTGGCCACCACCATAAGCCAGGCCTCGGGGAG 
GGCACCCCCTAAGACCACAGTGGCCAAGATCACAGTGGCCACGGCCATGGCCACAGTCATG 
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GTGGCCACGGCCACAGGCCACTAATCAGGAGGCCAGGCCACCCTGCCTCTACCCAACCAGG 
GCCCCGGGGCCTGTTATGTCAAACTGTCTTGGCTGTGGGGCTAGGGGCTGGGGCCAAATAA 
AGTCTCTTCCTCCAAGCT 

5 SEQ ID N° 48 >gi|46I8444|gb|AI609277. IjAI609277 tw83gl2..\I NCI_CGAP_HN5 Homo sapiens 
cDNA 

clone IMAGE:2266342 3' similar to gb:X06233 CALGRANULIN B (KUMAN):, niRNA 
sequence 

GACTTGGAGGAAGAGACTTTATTTGGCCCCAGCCCCTAGCCCCACAGCCAAGACAGTTTGA 
10 CATAACAGGCCCCGGGGCCCTGGTTGGGTAGAGGCAGGGTGGCCTGGCCTCCTGATTAGTG 
GCTGTGGCCGTGGCCACCATGACTGTGGCCGTGGCCGTGGCCACTGTGATCTTGGCCACTG 
TGGTCTTAGGGGGTGCCCTCCCCGAGGCCTGGCTTATGGTGGTGGCCAGGGCCCTCGTCAC 
CCTCGTGCATCTTCTCOTGGGAGGCCCAGGTTAGCCTCGCCATCAGCATGATGAACTCCTCG 
AAGCTCAGCTGCTTGTCTGCATTTGTGTCCAGGTCCTCCATGATGTGTTCTATGACCTTTTC 
15 ATTCTTATTCTCCTTCTTGAGAAAATTTTGCAGATCTTTTCGCACCAGCTCTTTGAATTCCC 

SEQ ID N° 49>gi|4998166|gb|AI708390.i|AI708390 atl3b02.xl Barslead aorta HPLRB6 Homo 
sapiens cDNA clone IMAGE:2354955 3' similar lo gb:X06233 CALGRANULIN B 
(HUMAN);, mRNA sequence 
20 TGACTTGGAGGAAAAAACTTTATTTGGCCCCAGCCCCTAGCCCCACAGCCAAAACAGTTTG 
ACATAACAGGCCCCGGGGCCCTGGTTGGGTAGAGGCAGGGGGGCCTGGCCTCCTGATTAGT 
GGCTGTGGCCGGGGCCACCATGACTGTGGCCGGGGCCGGGGCCACTGTGATCTTGCCACTG 
GGGTCTTAGGGGGTGCCCTCCCCGAGGCCTGGTTTATGGTGGTGGCCAGGGCCCTTGTCAC 
CCTTGTGCATTTTTTCGTGGGAGGCCCAGGTTAGCCTCGCCATCAGCATGATGAACTCCTC 

25 

SEQ ID N** 50 >gi|5037688|gb|AI720432. I|AI720432 as81fD9.xl Barstcad colon HPLRB7 Homo 
sapiens cDNA clone ]MAGE;2335145 3' similar togb:X06233 CALGRANULIN B 
(HUMAN);, niRNA sequence 

GGAGGAAGAGACTTTATTTGGCCCCAGCCCCTAGCCCCACAGCCAAGACAGTTTGACATAA 
30 CAGGCCCCGGGGCCCTGGTTGGGTAGAGGCAGGGTGGCCTGGCCTCCTGATTAGTGGCTGT 
GGCCGTGGCCACCATGACTGTGGCCGTGGCCGTGGCCACTGTGATCTTGGCCACTGTGGTC 
TTAGGGGGTGCCCTCCCCGAGGCCTGGCTTATGGTGGTGGCCAGGGCCCTCGTCACCCTCG 
TGCATTTTCTCGTGGGAGGCCCAGGTTAGCCTCGCCATCAGCATGATGAACTCCTCGAAGCT 
CAGCTGCTTGTCTGCATTTGTGTCCAGGTCCTCCATGATGTGTTCTATGACCTTTTCATTCTT 
35 ATTCTCCTrCTTGAGAAAATTTTGCAGATCTTTTCGCACCAGCTCTTTGAAT^^ 
CAGGGTGTCTGGGTGCCCCA 

SEQ ID N° 51>gi|188689|gb|M21064.1tHUMMRP14A Human migration inhibiloiy factor-related 
protein 14 (MRP 14) gene, complete cds 

40 ATCACTGTGGAGTAGGGGAAGGGCACTCCTGGGGTGGCAAGGTGGGAGGTGGGCCCTGTG 
TTCCCACAGTGGGCAGGGAGGTAGTGAAAGGGAAGCTGGCCGGACAGGAAGGGCCATTCC 
AAGAGGGCTTTGTGCGCAGGGCTAAGCCAAGCTTTCTCCATAGGCAATGGGGAGCAACTGG 
AGGTTCGTAGCAGGAGAAGGACACATCAAGCCCACCAGGAGGCTAAGTAAAAACAGTTGT 
CrrCCCAAGTTATAAGTTCCTGGAACCCTTGCTGGGAGCAGGATTTAGAAAAATGATGCTGA 

45 GAGATGCTAGAAACATATTCGCCCTGAGGCTCTCTCACTCAGACTGCAAGAGGAAGGTATC 
ATCAGAATTGCCCTTAACCAGGAACCAGAATAGCTGGGTCCCCTTCCTGCCAAGTCAGCAA 
CCAGCTATGTGACCTTGCTCAGGTCCATCTCCGGGTGTCAGTTTCTTCATCTACAATGCAAG 
AGGGTTGCCCACCTCTGAGAACCCTTCTAACCCCAAATCTCACCCTATGAATCTAAGAACA 
CAACCCCTCGCCATCCTAAGTATCACAGAGCCAGGCAAGCATGGGTGAGAGCTCAGACCAT 

50 CCTTGTTGGACTAAAAGGAAGGGGCAGACTGCCATGGGGGGCAGCCGAGAGGGTCAGGCC 
CCCATAGGTCCTCAGCCTGCTTCAACCTCAAAGGGGATGGGGGGCTGAGTGGTGCCAGAGG 
AGCAGCAGGCTCG(rrCGGGGAGAGTAGGGCCTTAGGATAGAAGGGAAATGAACTAAACAA 
CCAGCTrC(rrGCAAACCAGTTTCAGGCCAGGGCTGGGAATTTCACAAAAAAGCAGAAGGCG 
CTCTGTGAACATTTCCTGCCCCGCCCCAGCCCCCTTCCTGGCAGCATTAGCACACTGCTCAC 



99 



CTGTGAAGCAATCTTCCGGAGACAGGGCCAAAGGGCAAGTGCCCCAGTCAGGAGCTGCCTA 
TAAATGCCGAGCCTGCACAGCTCTGGCAAACACTCTGTGTGGCTCCTCGGCTTTGGTAAGT 
GAGCTGCCAGCTTCCCCAGGCAGAAGCCTGCCTGCCGATTCCTTCTTTCCTTCCCTGACCCA 
ACnTCCTTCCAAATCCTCCTCCTAGAAGCCCTCCTTGGTTGGCCCTGCCTACTTTAAAGCTT 
5 CTTTCACATTTTCTTAGGTCATGTTCCCCTGGGGCCTCCTGCCCTCAAATGCTTTGCTTTTTG 
GCACTCTGTAGATATTCTAAAAAATCATTTTGTACATGTGTGTGACAGGCCATCTCCCAGTT 
AAGTTGCAGCCTGTGCTTTCl I 1 ATTTTGCACTTCCCCCACrATTTCTGTGAGTGCTTAGT 
AGGAAGTGTCAAAGAAGCTTGACAGCATTTTCTTCTAAGTGTCCCAACrCTTGGTTTTCCAT 
TACACAGACAGAGTGCAAGACGATGACTTGCAAAATGTCGCAGCTGGAACGCAACATAGA 

10 GACCATCATCAACACCTTCCACCAATACTCTGTGAAGCTGGGGCACCCAGACACCCTGAAC 
CAGGGGGAATTCAAAGAGCTGGTGCGAAAAGATCTGCAAAATTTTCTCAAGGTAGGGCTGG 
ACTCTGGCAGGTCTGACCCAGCCTCACCGCAGTTTGGGTTGACAAGGGAGGATGGGAGTAT 
GGGCTACAGCAATCAAGGGGAAGATTTGAGCTCCTGGAGCCCAGCCCCAAGACGCAGCGA 
GTGTCCTGTTATACAGGGCAGGTGCTCACAGTTACACAGGACGACAGGGTCAAGAAATTGC 

15 TCAATTGAACACCTGCTATTTGTCGGGCCCTGTTCTGGGCAGAGGGATGTAGTGGTAAATG 
GGAGCCCACTATTCCATGAGGAGACACACAGTAAAGTTGTTGGCCAATAAAGAGCACAGAT 
AAAGCCAAATGCCAATAAGTGCCTGGAAGAAAATGAGATAGAGTGCGCTGTGGGCAATGG 
GGCTGGGTGGGGTGGAGGTGACCAGTTAGGGTACATGAGAAGGGCCTCTTTGAGGAGGTA 
ACATTTGAGCTGAGCCCCGAATGTTGGGGAGGGAAGCCCCTGAGGATGACACTTGGCACAA 

20 AGCTGAGGAGACCCTAAGCCTCAGGGCGAACTTGGGGTGGAAGACTTGGGGGCTTTTCTAA 
TCCTAAGGGTCTGCGGTGGAAAATGAATGCATAAAGAGCACATGGAGAGCACCTGCACAG 
CACTCAGGGAACTGGGAGGTTTTTCCCCCGCTCCAAAAATGATTAGGCAGTTCTAAGAAAA 
AGGCTGAGCACTTCCAACAGCCTTTTTGTTTTCTTTTCAAATTTGGGGAAAGTCGGGAAACA 
GAGGCCTGCATTAAGAAGGGTGGAACACATGGGTCTCAGTCTCAGTTCCAGTCCCGGAGCC 

25 AGACATCCTGGGGTAGGTCCCCAGCCCTCCCAGTGCCCCTCCCTCCGCCTTGGTAAGGTGG 
AGAATTGCAGCCTTCAGAGTTAGGGGCCCTGACAGCTCTCCATAGGTGGAGGCCTCAGGCA 
GGCAGGATGCTGGGTGGGGTAGGCAAGAAAGGGCCCAGCAGAGAGGCCGCATCGGAAAAC 
TATCCTCCATGTGACCCCCTATGCCCGCTTCACCCCCCACCTGACATCCCCCACCAGAAGCA 
AAGCGATGCTGTGGGAAAGGAAGCAGAGCCTCATGGATGGGCTGCACAGGAGAGTGCTCG 

30 CATTGGCTGGGTACCCCACAGGTTCTGGGAGGGGACTTAGCGAGGTGACTCAGTGCCTCGG 
CCTCCCAAAGTGCTGGGATTACAAGCATGAGCCACCCTGTCCGACCATCTCCCCTTTTATAC 
TTTATCACACCCTTGAGGTCAGCGGAGCACATACTCTGCTCTCTGACCCTCCATCTCCCCTG 
CCCACACCTAGGTTTTTCTAGTGTTTCCCCGTTGTATTGGTTGAAATAAGTTTCACTAATTG 
GTAACCTCCAGAGGGAAGGGAAGGGAGGGCAGGGGAAGGAGTGAAGTGCAGAGGGGTAG 

35 CAGAGTGGAACTGGCCTCTAAGTCAGATCTGAATTTGCATGCCCTCAATAGTCAAGCCTGT 
GAAAACTAATGACCCTCTCTAGGACTGGTTTCAAGTCTTCCTCCAGGAAGATACCATTCCTA 
GCTGTTAAAGTTGTTATAAGGACCAAATGAGGTGACATTTCCAGGCTTACTCATGCCATGA 
CCAGGGCAAGACCCTGGAACTCAGCTTCCTCTTCTATAAATAGAGAATCAGCACCCAAGTC 
ACAGGGTCATGGAGGGAATAAACTGGAGAGCGTTTGGTATGTGCTCAGTGTCTGCTCCATT 

40 GTGCGCACTCAGCCTATGGTCATTTTTAATTTTTAAATCCAGCCCCAGGGTCGAGGCTTCCT 
TGTACATTTGCCAGCTGGTCATTTACTGTGCTCCCAGTCCCCACCTCTGGCCACACCCAGCT 
CTCACAGCCTTCTCTCCCCACCCGCAGAAGGAGAATAAGAATGAAAAGGTCATAGAACACA 
TCATGGAGGACCTGGACACAAATGCAGACAAGCAGCTGAGCTTCGAGGAGTTCATCATGCT 
GATGGCGAGGCTAACCTGGGCCTCCCACGAGAAGATGCACGAGGGTGACGAGGGCCCTGG 

45 CCACCACCATAAGCCAGGCCTCGGGGAGGGCACCCCCTAAGACCACAGTGGCCAAGATCA 
CAGTGGCCACGGCCACGGCCACAGTCATGGTGGCCACGGCCACAGGCCACTAATCAGGAG 
GCCAGGCCACCCTGCCTCTACCCAACCAGGGCCCCGGGGCTGTTATGTCAAACTGTCTTGG 
CTGTGGGGCTAGGGGCTGGGGCAAATAAGTCTCTTCCTCCAAGTCAGTGCTCTGTGTGCTTC 
TTCCACCTCITCTCCAACCCTGCCTTCCCAGGGCTCTGGCATTTAGACAGCCCTGTCCTTAT 

50 CTGTGACTCAGCCCCCTCATTCAGTATTAACAAAATGAGAAGCAGCAAAACATGGGTCTGT 
GCTGGGCCCCTTGGCTCACCTCCCTGACCATGTCCrCACCTCTGACTTCAGGCCCCACTGTT 
CAGATCCCAGGCTCCCTGCCCCATCTCAGACACCCTGTCCAGCCTGTCCAGCCTGACAAAT 
GGCCCTTGTCACTGTACACTGTAGAAAGCAAAAAGGCATATCTCTACCCCTTGATATGCCT 
GCTACCTCACCAACCAGCCCCAAGCCTGTCTTCACCCATCACTGTCTACACAGCCCTCTCTC 
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TCTCCTAACAGAATTCTATTCCTCTGAAAGTCTTCAGAAACTGGACCTAGATAGTGCCATGT 
CTGGGGAGGAATATGGCACCAGGCAGTGGAAACAAGGACAGATCGGTGTGTTATCTCACAT 
TTGATCAGAGAGCATGATCTCTCTTAACAGACCTGCCACCCTAATCAACGGGAGTGCTCAC 
ACAAGTGGGAGTCTGAGAGCTTAGCCCTATGCCCACCCTGG 

5 

SEQ ID 52>gij4506772|reflNM_002965.1|S100A9| Homo sapiens S 100 calcium-binding protein 
A9 (calgranulin B) (S100A9) inRNA 

AATTCGCTCGGCTTTGACAGAGTGCAAGACGATGACTTGCAAAATGTCGCAGCTGGAACGC 
AACATAGAGACCATCATCAACACCTTCCACCAATACTCTGTGAAGCTGGGGCACCCAGACA 

10 CCCTGAACCAGGGGGAATTCAAAGAGCTGGTGCGAAAAGATCTGCAAAATTTTCTCAAGAA 
GGAGAATAAGAATGAAAAGGTCATAGAACACATCATGGAGGACCTGGACACAAATGCAGA 
CAAGCAGCTGAGCTTCGAGGAGTTCATCATGCTGATGGCGAGGCTAACCTGGGCCTCCCAC 
GAGAAGATGCACGAGGGTGACGAGGGCCCTGGCCACCACCATAAGCCAGGCCTCGGGGAG 
GGCACCCCCTAAGACCACAGTGGCCAAGATCACAGTGGCCACGGCCATGGCCACAGTCATG 

15 GTGGCCACGGCCACAGGCCACTAATCAGGAGGCCAGGCCACCCTGCCTCTACCCAACCAGG 
GCCCCGGGGCCTGTTATGTCAAACTGTCTTGGCTGTGGGGCTAGGGGCTGGGGCCAAATAA 
AGTCTCTTCCTCCAAGCT 

SEQ ID N^SS > NAME = 'Reverse-Translation of SAP B FR' : TYPE = DNA 
20 GAYAAYGGNGAYGTNTGYCARGAYTGYATHCARATGGTNACNGAYATHCARACNGCNGTN 
MGNACNAAYWSNACNTTYGTNCARGCNYTNGTNGARCAYGTNAARGARGARTGYGAYMG 
NYTNGGNCCNGGNATGGCNGAYATHTGYAARAAYTAYATHWSNCARTAYWSNGARATHGC 
NATHCARATGATGATGCAYATGCARGAYCARCARCCNAARGARATHTGYGCNYTNGTNGGN 
TTYTGYGAYGARGTN 

25 

SEQ ID N° 54>gij337755|gb|J03015.1|HUMSAP Homo sapiens sphingolipid aciivator proiein I 
mRNA. 3' end 

CGCGCTATGTACGCCCTCTTCCTCCTGGCCAGCCTCCTGGGCGCGGCTCTAGCCGGCCCGGT 
CCTTGGACTGAAAGAATGCACCAGGGGCTCGGCAGTGTGGTGCCAGAATGTGAAGACGGC 

30 GTCCGACTGCGGGGCAGTGAAGCACTGCCTGCAGACCGTTTGGAACAAGCCAACAGTGAA 
ATCCCTTCCCTGCGACATATGCAAAGACGTTGTCACCGCAGCTGGTGATATGCTGAAGGAC 
AATGCCACTGAGGAGGAGATCCTTGTTTACTTGGAGAAGACCTGTGACTGGCTTCCGAAAC 
CGAACATGTCTGCTTCATGCAAGGAGATAGTGGACTCCTACCTCCCTGTCATCCTGGACATC 
ATTAAAGGAGAAATGAGCCGTCCTGGGGAGGTGTGCTCTGCTCTCAACCTCTGCGAGTCTC 

35 TCCAGAAGCACCTAGCAGAGCTGAATCACCAGAAGCAGCTGGAGTCCAATAAGATCCCAG 
AGCTGGACATGACTGAGGTGGTGGCCCCCTTCATGGCCAACATCCCTCTCCTCCTCTACCCT 
CAGGACGGCCCCCGCAGCAAGCCCCAGCCAAAGGATAATGGGGACGTTTGCCAGGACTGC 
ATTCAGATGGTGACTGACATCCAGACTGCTGTACGGACCAACTCCACCTTTGTCCAGGCCTT 
GGTGGAACATGTCAAGGAGGAGTGTGACCGCCTGGGCCCTGGCATGGCCGACATATGCAA 

40 GAACTATATCAGCCAGTATTCTGAAATTGCTATCCAGATGATGATGCACATGCAACCCAAG 
GAGATCTGTGCGCTGGTTGGGTTCTGTGATGAGGTGAAAGAGATGCCCATGCAGACTCTGG 
TCCCCGCCAAAGTGGCCTCCAAGAATGTCATCCCTGCCCTGGAACTGGTGGAGCCCATTAA 
GAAGCACGAGGTCCCAGCAAAGTCTGATGTTTACTGTGAGGTGTGTGAATTCCTGGTGAAG 
GAGGTGACCAAGCTGATTGACAACAACAAGACTGAGAAAGAAATACTCGACGCmTGAC 

45 AAAATGTGCTCGAAGCTGCCGAAGTCCCTGTCGGAAGAGTGCCAGGAGGTGGTGGACACGT 
ACGGCAGCTCCATCCTGTCCATCCTGCTGGAGGAGGTCAGCCCTGAGCTGGTGTGCAGCAT 
GCTGCACCTCTGCTCTGGCACGCGGCTGCCTGCACTGACCGTTCACGTGACTCAGCCAAAG 
GACGGTGGCTTCTGCGAAGTGTGCAAGAAGCTGGTGGGTTATTTGGATCGCAACCTGGAGA 
AAAACAGCACCAAGCAGGAGATCCTGGCTGCTCTTGAGAAAGGCTGCAGCTTCCTGCCAGA 

50 CCCTTACCAGAAGCAGTGTGATCAGTTTGTGGCAGAGTACGAGCCCGTGCTGATCGAGATC 
CTGGTGGAGGTGATGGATCCTTCCTTCGTGTGCTTGAAAATTGGAGCCTGCCCCTCGGCCCA 
TAAGCCCTTGTTGGGAACTGAGAAGTGTATATGGGGCCCAAGCTACTGGTGCCAGAACACA 
GAGACAGCAGCCCAGTGCAATGCTGTCGAGCATTGCAAACGCCATGTGTGGAACTAGGAG 
GAGGAATATTCCATCTTGGCAGAAACCACAGCATTGGTTTTTTTCTACTTGTGTGTCTGGGG 
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GAATGAACGCACAGATCTGTTTGACTTTGTTATAAAAATAGGGCTCCCCCACCTCCCCCATT 
TCTGTGTCCTTTATTGTAGCATTGCTGTCTGCAAGGGAGCCCCTAGCCCCTGGCAGACATAG 
CTGCTTCAGTGCCCCTTTTCTCTCTGCTAGATGGATGTTGATGCACTGGAGGTCTTTTAGCC 
TGCCCTTGCATGGCGCCTGCTGGAGGAGGAGAGAGCTCTGCTGGCATGAGCCACAGTTTCT 
5 TGACTGGAGGCCATCAACCCTCTTGGTTGAGGCCTTGTTCTGAGCCCTGACATGTGCTTGGG 
CACTGGTGGGCCTGGGCTTCTGAGGTGGCCTCCTGCCCTGATCAGGGACCCTCCCCGCTTTC 
CTGGGCCTCTCAGTTGAACCAAAGCAGCAAAACAAAGGCAGTTTTATATGAAAGATTAGAA 
GCCTGGAATAATCAGGCTTTTTAAATGATGTAATTCCCACTGTAATAGCATAGGGATTTTGG 
AAGCAGCTGCTGGTGGCTTGGGACATCAGTGGGGCCAAGGGTTCTCTGTCCCTGGTTCAAC 

10 TGTGATTTGGCTTTCCCGTGTCTTTCCTGGTGATGCCTTGTTTGGGGTTCTGTGGGTTTGGGT 
GGGAAGAGGGCCCATCTGCCTGAATGTAACCTGCTAGCTCTCCGAAGCCCTGCGGGCCTGG 
CTTGTGTGAGCGTGTGGACAGTGGTGGCCGCGCTGTGCCTGCTCGTGTTGCCTACATGTCCC 
TGGCTGTTGAGGCGCTGCrrCAGCCTGCACCCCTCCCTTTGTCTCATAGATGCTCCTTTTGA 
CCTTTTCAAATAAATATGGATGGCAAGCTCCTAGGCCTCTGCTTCCTGGTAGAGGGCGGCA 

15 TGCCGAAGGGTCTGCTGGGTGTGGATTGGATGCTGGGGTGTGGGGGTTGGAAGCTGTCTGT 
GGCCCACTTGGGCACCCACGCTTCTGTCCACTTCTGGTTGCCAGGAGACAGCAAGCAAAGC 
CAGCAGGACATGAAGTTGCTATTAAATTGACTTCGTGATITTTGTTTTGCACTAAAGT^ 
GTGATTTAACAATAAAATTCTGTTAGCCAG 

20 SEQ ID N° 55 >gi|33776l|gb|M32221. 1|HUMSAPABCD Human saposin proteins A-D mRNA, 
complete cds 

CGCGCTATGTACGCCCTCTTCCTCCTGGCCAGCCTCCTGGGCGCGGCTCTAGCCGGCCCGGT 

CCTTGGACTGAAAGAATGCACCAGGGGCTCGGCAGTGTGGTGCCAGAATGTGAAGACGGC 

GTCCGACTGCGGGGCAGTGAAGCACTGCCTGCAGACCGTTTGGAACAAGCCAACAGTGAA 

25 ATCCCTTCCCTGCGACATATGCAAAGACGTTGTCACCGCAGCTGGTGATATGCTGAAGGAC 
AATGCCACTGAGGAGGAGATCCTTGTTTACTTGGAGAAGACCTGTGACTGGCTTCCGAAAC 
CGAACATGTCTGCTTCATGCAAGGAGATAGTGGACTCCTACCTCCCTGTCATCCTGGACATC 
ATTAAAGGAGAAATGAGCCGTCCTGGGGAGGTGTGCTCTGCTCTCAACCTCTGCGAGTCTC 
TCCAGAAGCACCTAGCAGAGCTGAATCACCAGAAGCAGCTGGAGTCCAATAAGATCCCAG 

30 AGCTGGACATGACTGAGGTGGTGGCCCCCTTCATGGCCAACATCCCTCTCCTCCTCTACCCT 
CAGGACGGCCCCCGCAGCAAGCCCCAGCCAAAGGATAATGGGGACGTTTGCCAGGACTGC 
ATTCAGATGGTGACTGACATCCAGACTGCTGTACGGACCAACTCCACCTTTGTCCAGGCCTT 
GGTGGAACATGTCAAGGAGGAGTGTGACCGCCTGGGCCCTGGCATGGCCGACATATGCAA 
GAACTATATCAGCCAGTATTCTGAAATTGCTATCCAGATGATGATGCACATGCAACCCAAG 

35 GAGATCTGTGCGCTGGTTGGGTTCTGTGATGAGGTGAAAGAGATGCCCATGCAGACTCTGG 
TCCCCGCCAAAGTGGCCTCCAAGAATGTCATCCCTGCCCTGGAACTGGTGGAGCCCATTAA 
GAAGCACGAGGTCCCAGCAAAGTCTGATGTTTACTGTGAGGTGTGTGAATTCCT GGTG AAG 
GAGGTGACCAAGCTGATTGACAACAACAAGACTGAGAAAGAAATACTCGACGCTTTTGAC 
AAAATGTGCTCGAAGCTGCCGAAGTCCCTGTCGGAAGAGTGCCAGGAGGTGGTGGACACGT 

40 ACGGCAGCTCCATCCTGTCCATCCTGCTGGAGGAGGTCAGCCCTGAGCTGGTGTGCAGCAT 
GCTGCACCTCTGCTCTGGCACGCGGCTGCCTGCACTGACCGTTCACGTGACTCAGCCAAAG 
GACGGTGGCTTCTGCGAAGTGTGCAAGAAGCTGGTGGGTTATTTGGATCGCAACCTGGAGA 
AAAACAGCACCAAGCAGGAGATCCTGGCTGCTCTTGAGAAAGGCTGCAGCTTCCTGCCAGA 
CCCTTACCAGAAGCAGTGTGATCAGTTTGTGGCAGAGTACGAGCCCGTGCTGATCGAGATC 

45 CTGGTGGAGGTGATGGATCCTTCCTTCGTGTGCTTGAAAATTGGAGCCTGCCCCTCGGCCCA 
TAAGCCCTTGTTGGGAACTGAGAAGTGTATATGGGGCCCAAGCTACTGGTGCCAGAACACA 
GAGACAGCAGCCCAGTGCAATGCTGTCGAGCATTGC AAACGCCA TGTGTGGAACTAGGAG 
GAGGAATATTCCATCTTGGCAGAA ACCACAGCATTGG 1111111 CTACTTGTGTGTCTGGGG 
GAATGAACGCACAGATCTGTTTGACTTTGTTATAAAAATAGGGCTCCCCCACCTCCCCCATT 

50 TCTGTGTCCTTTATTGTAGCATTGCTGTCTGCAAGGGAGCCCCTAGCCCCTGGCAGACATAG 
CTGCTTCAGTGCCCCTTTTCTCTCTGCTAGATGGATGTTGATGCACTGGAGGTCTTTTAGCC 
TGCCCTTGCATGGCGCCTGCTGGAGGAGGAGAGAGCTCTGCTGGCATGAGCCACAGTTTCT 
TGACTGGAGGCCATCAACCCTCTTGGTTGAGGCCTTGTTCTGAGCCCTGACATGTGCTTGGG 
CACTGGTGGGCCTGGGCTTCTGAGGTGGCCTCCTGCCCTGATCAGGGACCCTCCCCGCTTTC 
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CTGGGCCTCTCAGTTGAACCAAAGCAGCAAAACAAAGGCAGTTTTATATGAAAGATTAGAA 
GCCTGGAATAATCAGGCTTTTTAAATGATGTAATTCCCACTGTAATAGCATAGGGATTTTGG 
AAGCAGCTGCTGGTGGCTTGGGACATCAGTG 

5 SEQ ID N° 56>gi|3451333|gb|ACO05525. ljACO05525 Homo sapiens chromosome 19. cosmid F22162. 
complete sequence Perlecan 

GATCTTGGCTCACTGCAACCTCCGCCTCCAAGGTTCAAGCGATCCTCCCACCTCAGCCTCCC 
AAGTAGCTGGGATTACAAGCGTGTGCTATCACACCTGGCTAATTTTTATATTTTTGGTAGAG 
ATGGGGTTTCACCTTGTTGGTTAGGCTGGTCTTGAACTCCTGACCTCAGGTGATCTGCCTGC 

10 CTCAGCCTCCCAAAGTGCTGGGATTACAGGTGTGAGCCACCGCGCCCAGCCTGACCCTTTC 
TTTCrCTACTGGCAAAACTCCTGCTCCTTTTTAAAGCCAAGCTCATGTCACCTCCTCTGTGA 
AGTCCTCGCTGACTCCCCAAGCGGTCAGTGTCTCTCTCGTATGGGCTCCCCGGCCCCTGCAC 
TGCTCTCCATCACACCCTGACCACTCTGGGCAGTGGCCCCCCTCCCCACCCACTGACTATGG 
GCTCCTTGAAGGCAGGGCCTGGGTCTGCCCCATCTCTGTGTCCCCAGCAATGCTGGGCATG 

15 AGTCAGCCTCAGAAGACATCTGCTGAATGGCTGCAAACCAGAGGAAATATCTCCAGCCTCA 
GGCTGGGACCCCTCCCCTCTCTCCTCCCACCTCTGACTTCATACCACTCACCCTCCAGAGTC 
TTCAATGCCCACTATTACTTCACACAGTTGGCCTGTGACAGGCAATCAGGTCATCGTCCACG 
GCTACCAGGTGTTTCATGTCTACTGTGACTTCCAGGACCACAAGCCCTTTTGCGCCCACCAT 
GTCTTCACCTAAGAGATCTTCAAAGCCCAGTATGTCTCTGGCACCCAGTGGATCCTCCATGC 

20 CCACTGCGGATCCCAAGCCTCCTGCCTCCTTGAAGTCCACCAAATCAGCAACACCCAACAG 
ATCCTTAGTGCCCACCAAACCAGCGACATCCCGTAACTCAGTCATGAGCCCAAGCAGTTCC 
AAGTCCACCAAATCGACCAGTACAAAAAGAGCCCCTTCTAACCGGCCCAGCAGCAGGTCCC 
GAGTCCGCAGCAAAGCAAGAACACCCAGCAGGGTGAGCACCGACACCAGGACCAGCAAAG 
CCAGCAAGGCCAGCGACGTGAGATGCCACCAGCGGAGGGGCACACACAGCCGGGGTAGGA 

25 CACCTGGCAGAAGGGGAAGCCGCAGCTCCAAGAGGTCACCCAGCAGGGCCAGCACTCCTG 
GCAGGATAAGAACTCATGGTGCCAGACCAGGCATGGCCAGCAGGGTGAGAACTCCCACTTC 
ACAGCAAAAAGGGAGCCGGGGAAAGAGTTACGGCCGGCCTAGAACCAGCAACAGGGAAA 
GGAGTGACAGCCAGCCTAGAAATCTGAGCAAGAAGAGTTACCGCCCACCAGGAGGCTCAG 
GTATAGGGAGGAGTTCCGAGCTGGCTGTAACTCCCAGTACAGCCAAGTGTCAAACCCCGAC 

30 TGGAATTCCCTCCAAGGAGAAGAGTGACAACCCATCTCCATCCTCATCAAGGAAGGTGAAG 
AGCTACGGTCAGATGATCATCCCCAGTAGGGAAAAGAGTTACAGCCCCACTGAAATGTCCA 
GCAGGGTCAAGAGTTATAACCAGGCCAGCACCCGCAGCAGGCCGCAAAGTCACAGCCAAT 
CTAGAAGCCCCAGAAGGTCAAGAAGTGGCAGTCAGAAGAGGACGCACAGCAGAGTGAGAA 
GTCACAGTTGGAAGAGAAACCATAGCAGGGCAAGAAGTCGCACCCGGAAGGGAATTCTGA 

35 GCCAGATGGGAAGACACAGCCAGTCTAGAAGCCACAGCAAGGGGAAAAGTCAAAACCAAT 
CTAGAACCCCCAGAAGAGGAAGAAGTCACAACTGGTCTAGAAACCCCAGCAAGGAAAGAA 
GTCATAGCCATTCCAGAAGCTCCAGCAAAGAGAGAGATCACAGGGGATCTAGCAGCCCCA 
GGAAGGAGAGTGGTCGCAGTCAATCAGGAAGCCCCAACAAGCAGAGAGATCACAGCCGAT 
CTAGAAGTCCCAACAAGGCGAGAGATCGCAGCCGATCTAGAAGTCCCTACAAGGCGAGAG 

40 ATCGCAGCCGATCTAGAAGTCCCAACAAGGCGAGAGATTGCAGCCGATCTAGAAGTCCCTA 
CAAGGCGAGAGATCGCAGCCGATCTAGAAGTCCCAACAAGGCAAGAGATCATAGCCGATC 
TAGAAGTCCCAACAAGGCGAGAGATCGCAGCCGATCTAGAAGCCCCAGCAAGGAAAGAGA 
TCACAGCCAACTTGGAAGCCCCAGCAAAGAGAGAGATCACAGACGATCTAGAAGCCCCAG 
CAAGGAGAGACAGTGCAGACAATCTAGAAGCTCCAGCAAAGAGAGAGATCACAGACGATC 

45 TAGAAGCCCCAGCAAGGAGAGACAGCGCAGACAATCTAGAAGCCCCAACAAGGAGAGAGA 
TCGCAGCCAATCTAGAAGCCCCAGCGAGGAGAGAGAGCACAGACAATCCAGAAGCCCCAG 
CAAAGAGAGAGATCGCAGACGATGGAGAAGCCCCAGCAAGGAGAGAGAGCGCAGACAAT 
CTAGAAGCTCCAGCGAGGAGAGAGATCACAGCCGATCTAGAAGCCCCAATAAGCAGAGTG 
GTTACAGTCGACCTAGAGCCTCCAGCAAGGAGAAAGCTCATAGCCGATCTAGAACCCCCAG 

50 CAAAGAAGGAAATCATAGCCAATCTAGAACCTCTAGCAAGGAGAGCGACCCCAGTCAATC 
TACAGTCCCCAGAAGTCCCGACTGGAAGAGATCCCCTACTAGGACAAGCAGTCTCAGTCAG 
AATAGAACCCCTAGCAAGACAAGCAGCCACTCCCCATCAACATTTCCCAGTGGGGGCCAAA 
CCCTAAGCCAGGATGACAGTCAAGCCGACGCCACCACCTCTAAGGCCACCTTACCTGGGGA 
AAGGTCTTCATCATCTTCTTCCAAGCTGGCGTAGCCCCCAGTCTCAGCTGGCTCACGGGTCT 
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CTGTCATGACCGGGGGAGGGGACAGGAGACAGGAGCAGAGCAGCAGCTGAGCAGCGTCCC 
TCCCCGGCCAGCTCTCCACAGCCACACCTCCGGCCACAAGTTCTCTAATACAGGATGTTGG 
CAGGTAGAGAGGGATGCTGGATAGGGGGAAAGGAAAGACCTGTGATGATTCAATAAATTT 
TTACATAGCACCCATCCCCACCAAGCCCAACTGTGTGCTCACTGCTGGCATGGGGCACAGA 
5 GGACCCCAGCTCTGTCCCTGACTGTCTACAGGGTCTTGACTGCAAGCCCTGCCCCTCTCTAG 
GTC'i'lU-lMlllirilGAGACAGAGTCTCTCTCTGTTGCCCAGGCTGGAGTGCAGTGGTGTGA 
TCTCAGCTCACTGCAACCTCCACCTCCCAGGCTCAAGCAATTCTCCTACCTCAGCTTCCCGA 
GTAGCTGGAACTACAAGTGTGCGTCCTCACGCCCGGCTAATTTTGTATTTTTAGTAGAGATG 
GGGCTTCACCATGTTGGCCAGGCTGGGCTCGAACTCCTGACCTCAGGTGATCCACATGCCT 

10 CAACCTCGCAAAGTGCTGGGATTATAGGCATGAG 

CCACCGCACCCGTCCCCCTCTCTAGGTCTTAATTTCCGCATGTGGGCAACAAGGCTGCCTTC 
TGGTTCTTATTCAGTGGGGTAGGGAGAGGTGACACTCCAAATATTCAACAGTGGGGACTGG 
TGTGGGCACCAATCAGAACTGAGAGTGGAGCGGGACGGATACCAGGCCTTAACCCTTTAGT 
TGCTGGACCATGGGGAGGTCTGGGGTTGGGGAAGTGTTATGGGGAAAAAAAACCCTCAAA 

15 CTGTGTTTTTCCTCTACTCTCACACTATCACAACAATCATCAACACAGAATTCTGTGACCAA 
ATGTGTGGGGCTTTTTCCCCACACACTACACAGCAGACAACAGCTAGGTGTCCCCTCCGATT 
CCArrCCAACGCTGTCCCCACACCCAGCTAATTTTTGTATTTTTGGAAGAGACAGGGTTTCA 
CCATGTTGCCCAGAGCTCAAGCAATCTGCCCACTTCAGCCCTCCAAAGTGCTGGGATTACA 
GGCGTGAGCCACCACACCCGACTTTTTTAAAAAAATAAAAATAAGGCCGGGCGCAGTGACC 

20 CATGCCTGTAATCCCAGCACTTTGGGAGGCCGAGGTGGGCAGATCaCCTGaGCTCAGGAGT 
TTGACACCAGCCTAGGCAACATGGCAAACTTGTCTCTAAAAAAAAAAAAAAAATTACAAA 

agttagccggtgtggtggcatgtgcttatagtcccagctacctgagaggctgaggcaggag 
gataaattgagcctggaaggtcaaggctgcagtgagccgtgaccttgccactgcactcaag 
cctggatgacccatcttacaaaaaaaaaatttttgctggagctgctcacagaactcaagga 

25 aatgcttacttagatttactggtttattatagaggatattgcaaagaacaaagatgaagag 
atgtgtagggcaaggtataagggaaggggcagggagcttcacgccctccctggggtgctac 
cctacaggaaccctcaggtggttagctatgcggaagctctccaaacccagtcctcttgggt 
ttttacggaggctttaagacagcagcattgggcatggacttctctgaaaagtgtcttaaga 
ccaacaatcaagaaggtggggaagattagagtcttgccctggggcaggaaatggagggca 

30 ggaggaggtcagagagattctgtttcttcagacctgccccaggcctaaggtacacaacatt 
ataacaagagactgtaacaaaggctgtaggagttaccagccaggaactgtggatgaaaac 
caatatatttatatatataataccacaaggggggtccaaagtggcagttagggacagggag 
tacttgtgtagcagtgacacaccaacccatctggaagtattttaatatttaaacaattggta 
tggctatactagtttgtgattatcagccttagttctgtatcaattggcaagatagtgtctag 

35 gtttgccacactctagctgtgtagcaccaagcaaagaacttaacttctctagcctgtttcct 
tctctggaagaaaggggcttccaggccttaactcacgtactccccataactagactgggaa 
ttatctcctttgtacagatgaggaaacagacacagaggtgataagtgagtagcccaaggtc 
accatctggtaagtggatgaactaggattggaagccagacctttcataaaatgatttctca 
gctcaaaaggtttttctgaagattcagtaggctcactgatagaaattgctggtgtgtggct 

40 ggtattccatcaagagtggccattactactcccacccctgcccctctataaactccagatgt 
tccagacctctcatctctccctgtgcacacaaggccttttcacatctgtgggtcttagtaca 

CCCACTGTTGCTGTCAAGAATGTCCTCCTCCTCCl ri rrrri i ri ri riTTGAGATGGAGTCT 

CACTTTGTTGCCCAGGCTGGAGTACAGTAGCGCGATCTCAGCTCACTGCAACCTCTACCCTG 

CATCAGCCTCCCTAGTAGCTGGGATTACAGGCAGCCACCACCACCATGCCCGGCTAATTTTT 

45 TGGTATTTTTAGTAGAGACAGGGTTTCATTATGTCAGCCAGGCTGGTCTCAAACTCCTGACC 
TCAGGTGATCCATTTACCTTGGCCTCCCAGAGTGCTGGGATTACAGGCAAGAGCCACCACG 
CCCAGCCCTCCTTCCCCCTTTTTGGCCTGGAGAACTCCTTTTCACCCTTCAAAGCCCACCAC 
AAACATAAGAACCTCTATACTTCTTGCrCGCTGAAATACTGCCTCTGCCAGGAAGCCTTCTG 
TGACTTCTCTCTCTCCCTCTTCACCAACGGACCGCCCCCGCCCCCCACCAACCCCACCACAC 

50 ACACACACCACTACTGTCTTCCACTGTACTCCCTGACAGTAGAGAACCAAGCAGGGCCAGT 
TGATGCAGCCTCAGCTATATCTCTTACATGCCAAGGCCCATGCACTGGGGATACAATGGTG 
GAAAATACATGGTCCCTTCAAAGTCTGGATGTCAAGTTTAATGCTGGGGACTAAAGAGAAA 
AGCTTCAGATTGAAACCTGGAGGTGGCTGGGGCAAAGGACCATTGGCATCATTGGCAGGGC 
AACTTCCTAAAGAAAGCACCTAAATCTTGGCTTTTAAAGACAGATTTCATAATTGGCAGAG 
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GAGAATTCrAATGATACCCTATTGCCTACAGGGCCCCATCTAATTTGGGAATTCTACTTTAT 
ACC AAGATA AGATTGCCAGATTTAGCAAATAAAAACAGAAGACATCCAATTAA l 1 1 11 TI G 
TTTGTTTTTGGGTTTTTGTTGCGGAGATGGTGTCTCACTATGTTGCGAAGGCTGCTGTCAAA 
TTCCTGGCTCAAACAATCCTCCTGCCTTGGCCTCCCACTTCCCAAAGTGCTGGGATTACAGG 
5 CATGAGCTACCACACCTGGCCCTTATTrATTTATTTATTTAATTTTCTTTTTTGGG^ 

GTCACTCTGTCGCCCAGGTTGGAGCGCAGTAGCGCGATCTCGGCTCACTGCAACCTCTGCCT 
CCTGGGTTCAAGC GATTA TCCTGCCCCAGCCTCCCAAGTAGCTGGGACTACAGGCGCGTGC 
CACCATGCCCGGCl 1 11 ri i ri rriTl'l l'l l 1 IM rm iGAGACGGAGTCTTGCTCTGTCGCC 
CAGGCTGGAGTGCAGTGGCACGATCTCGGCTCACTGCAAGCTCCGCCTCCTGGGTTCACGC 

10 C ATTCTC CT GCCTCA GCCTTCCGAGTAGCTGGGACTACAGGCGCCTGCCACCACGCCCGACT 
ATTITTTGTATTTTTAGTAGAGATGGGGTTTCACCGTGTTAGCCAGGATGATCTCGATCTCC 
TGACCTCGTGATCCACCCGCCTCGGCCTCCCAAAGTGCTGGGATTACAGGCGTGAGCCACC 
GCGCCCAGCCTACTTATTTATATTTTTTAAGAGACAGGGTCTCGCTCAGTTGCCCAGGCTGG 
AGTGCAGTAGGGTGATCTGTAGGAAAGGGGCTTCCAGGCCTTAACTCATGTACTCCCCCAT 

15 AACCAGGTTGGGAGGTTAGCTCACTGTAACCTCAAACTCCTGTGCTCAAGGTACCCTACTA 
GCCCCTAGGAGAGCAG CTGGGACTACAGGTATGCGCCACCATGCCAGGCTTAATTTTTACT 
i n^-ri i^ riU ll'l rrri-l-rilGTAGAGACGGGGGTCTCACTATATTGCCCAGGCTGGTCTTG 
AACTCCTGGTCTCAAGCGATCCTCCTGCCTTAGCCTCCCAAAGTATTGGTATCACTGCAACT 
AGCCCAAAGAATTAATATAGCTATGTTCCATGTGATATTTGGGACATACTTTTCTAAAAGGT 

20 TGTATCTTTTGGATATAATTGTTTATCTGAAATTCAAATTTAACTAGACATTGTATATTTTAT 
ACGGCAACCACACACCTGGGACAATCAAGACATTCCCTGAAGTTACCAGGAGACAATGCCC 
ATCAGCCTACACTTTTCCAAGCCCACGTCACACAAGGCCCCTTCCAGAGTATTCCAGACGTC 
AGGTAGGGCCATCCCTTGGTTCACAAGTCCCACTCCTACCACGCCTATGGCAGCCAAACTG 
AAAGGCAAACACAGTGCTGGAGACCCCACAATGCCCTGGGCCTATAGCAGTCAATTCCCAA 

25 GATGCCCCGCGTGAACACAATAGGCACCCGTTCCAATGCTCGAGCAAAGAGACCAGGGCA 
AAACCTTCCACTACGGGACAATAACGGCCAGTTCCCACAATTCGTTGTGGCAGTTCTTCCCA 
GGATGCCTTAGGCCTATAGCGACCACCTTCCCAGACTCCCCGTGTGGAAGCGCTCCAAGCC 
TCCAGGACGGTCAGCGGCAGGTGTGGGATAAAAGGAACCGGTCTCGACAAGGATCTGGGA 
CACTCTTTCCCAGGATGCACCAGGCCTACGACTAGCGGACCGACTCCCACAGCGCTTCAAG 

30 GCGGAGCGCTCGGTTCTCCCAGGATGCCCCAGGGCGGCACAAACGCGTAGGGGGAGAAAA 
AGAAGCCCTCGGGTCACCACGGCCCCAGACCGCCGGCTCCCCGGTGACGGGAGTCGTCGCT 
CCCATCATGCAGCGGGGCCGTAGCGCCCGCTTCCCGGCATGCCTCGCGCACCCCTGCCCGG 
GACACTCACCGGCGCCGGCGGCCCCCGCTCCGGCTCTGCGGCGGCGGCTGCACGCCCAGCC 
TCTGCGCCTGCGTCGCAAGTAGGGTAGGACAGCGCGCAGGGGGCGTGAAGAGCCTAGGGC 

35 GCTTGCGCGGCGAGACGGACTAGTCCTGTAGCGCTGTGGGAAGAGGGGCTATGCGCGTCGG 
GCCGTCGACGAGACCCGCGCGGGGGGCGCCGTGCTTTGCCCCTCGCTGCCTGGGTTTACTT 
GGTACAGCCCGCGGCCCAAAGGAACAAGAAGCTGAAGGGTTCGCGCGTGCGTGTGCGGGG 
CAGGAACGCGCCTTACAAAACTGGGATGCGCTGGGGGTGGAGGGCGCTAGTTCGGACTGG 
ATCCTGGGCCCGAGGCCTGCTTATTTGCATAATCCTAGCGCGGGACAATGAAAGGCCTCCC 

40 GCACTGGAAGGAGTGATTTGCATATTCCCCGGAGGGGCCTTACTCCAGAGCGCAGTGATTA 
GCATATGGCGGGGGCAACCTGAGCAAAGCGCATGCGCGCAGGGACTGCAGACTGACGCGA 
AGTGGGTAGCCTTGTCTTCGTAGGGGATCAGTTTGCATC 

CTGAGAGAGGGCACGAGGGCCAGGACCCCTCCCAACCAGGATAAAGGTTTATTGATCTCCT 
AGGTGTCAGGCCCCATGCTGGCGGATTCTGTGGTTTCTGCAGTGAACCATACTCCTGTACTC 

45 ACGGCACCCCAGTCGAAGGAGATACGCACCTAATTAGACAACTACTACCCAGAAGGTCAG 
ACCTGGAGTGAGGAACACAGGGGGCTGTGGGAGCCTAAGAGGCGCTTGCCCCGGCCTCTG 
GTTCTAGAAAGACTTCCAGGAGGTGGTGATCCTTAAGCCAAGTACGAATAGGAGCCAACTA 
GAATGGGAATGGGTCTGGCAGAATGAACTGCAAGCGCCAAGGCCCAGAGGCCAAAAAAAA 
AAAAAAAAAAATAGAAGCGCATGTTTTGATTGAGGAAGCAAGAGCAGCTTAGTATGCCTA 

50 GAACCTAACTGGAGACGGGAAATGGTTCTATAGACGATGTTAGAGTTCAACTATGGCTACA 
TTCCAGTCTTCCTGTAAGTGACTTTGTCACATTCTGGCTTAAAACTCCCCCAAAGGGATCCC 
ATTAGGAAAAAAAAAAAATCCAAAAATCTTTATCATGGCCTCAGGGCTATACACCTGGTCT 
GGCCGTGCTTATCTTTCTGACCCCACCTACTTCCTCCTCCCTCCATTTCTGTCCAGCTCCACC 
TTACCCCAAACTCTTTACCAGCTCGGGCCTCTGCTCTTGCCGTTCCCTCCGCCTGAAAATGC 



105 



TTTTCCCTCTGACCTTTGAATACCTACTCTTGTGCTCACCATTCATATCTTGGTACAGATGTC 
AATCTGAGAGGCTTTTCCTGATCTCTCCATAATAGCACTTACACATTTGACTGGAGTTATGG 
ATAAATCGGGATTGGCCATGAGTTGGTGGTGGTTGTAACTGGCATGAAGAGTACATGGGGC 
TGGGCGCGGTGGCTCACGCCCGTAATCCCAGCACTTTGGGAGGCCGAGGCTGGTGTATCAC 
5 CTGAGGTCAGGAGCTTGAGACCAGCCTGGGCAACATGGTGAAACCCTGCCTCTATTAAAAC 
TACAAAAATTAGCCAGGGGTTATGGGGGGTGCCTGTAATCCTTGCTACTTGGGAGGCTGAG 
GCACGAAGATCACTTGAACCCTGGAGGCAGAGGTTGCATTGAGTCGAGATTGAGCCACTGC 
ACTCCAGCCTGGGCCACCCAGCGAGACTCTGGGTCTCGCCTGTAATCCCAGCACTTTGGGA 
GGCCGAGGCGGGCGGATCACGTCAGAAGATCGAGACCATCCTGGCCATCCTAGACCATTTC 
10 TACTAAAAATACAAAAAAAAAAAAAAAAAAATTAGCCGGGCGTGGTGGCAGGCGCCTGTA 
GTCCCAGCTACTCGGGAGGCTGAGGCAGGAGAATGGCGTGAACACGGGAGGCGGAGCTTG 
CAGTGATCCGAGATGGCGCTACTGCACTCCAGCCTGGGCGACAGAGCGAGACTTGGTCTCA 
AAAAAAAGAGTACATGGGACGTTATTGTCCTGTCTACTCCTGTGGGTTTGAAGTTTTCCATA 
ATGACAATGGCATACCACATCACCATACTCTGCATTTATATTAATAGTTCTTATCACAATCT 

15 GAACTTTCTTTGCTTCCTTGTTTTGAGTGTTTTCCTCATGAAAGCTTCATGAGGGTAAGAAT 
GGAGTCGCCCTTTTTCACTTTGGGTTCTCAATGCTTAGAGCAGGATCAGATTTCAGATTAGT 
GTAGCGCTGTCTTTAACACTTAACATTTGCCTGTTTTATTCACCATGGACTCTAGAACTTTG 
AGCAGCACCTGGCACATCGTAAGAGGTTATTTTTTAAAGTTAGAATAATACATCTAAAATG 
TACATGAATGAATGAGAGGCCTGGGATGCCAGACTAAAGAGCTTTGACTTGGTCTAAAGGT 

20 GATGGGGAGCTAGGCAAAGGTTTTGAGAGTTTAACTTTAATTCAAAGTTCCCTTGGAGACT 
AATGTCTGGGGTAGGGGGAAGCCAGGGTAAGGGTCCGGGCCATGGAATGGGGTAGCTCAG 
TCGCTATCAAAAAGACAAGACTGTGACTATTTGGCTGAAGAAATGGCCAAACCCAGGTTTC 
TGGGGAGGTCGAGGTACCCTCAGTGAGGTCAGGACCTTCTCCTGGCCTATACTGTCCACCA 
GCAACCATCACACTCCTCCCTCCCCTCTCCCTTAGTTCCCCTCCCAATGGTACAGCCCTTGA 

25 CAGCAGGACAGACACACAGCCACCCCAAACACTTGTTCTCTCCTCAGTTTAATGGTGGTTA 
GTGAGATTGCCAAACCCCCTCCCCATTCCCCTCCCCACCCCGTACAAAATGTGTGTGTGGTT 
TTTTGTTTTTTGTTTTTTG I 1 U N AACAAGAAAAAGGGGGCAAAAGCCAGGAATGGGGAGA 
GGGGGGTGC A ATCTG ATATTTTC AT AC AG ACTTTTG A I ' I " I " I' I " T A AT ATATT ATAT ATA A A AC 
CATGAAGACCACGAATCCTCCCCAAACTCCTTTCCCCCTCCCCGGGGGGCCTGGAGGAGAG 

30 ATGGGGAAGGCCCCCCCAGGAGTGGGTGGACAGAGAGACAAATATGGATGGGACAGACGT 
TGGGGGAGAAGGTAGAGAGAAGGGGAGCCCAGGAACCTGGGGAAGGGGGATTGGAGAAA 
AGGGTTGGGGCTGTCTCCCTCACTGCCCCCATCAAAGTTATGACACAAAGACACAGAATCC 
CTATTTCCACGCCCTCCCCCCACCCATCCCCCCACCGTGCAAACATGGCTTTGCAAAGAAGT 
GCCCAGAGCTCTGTGGAACTCTTACAATGGCTGGCATGGGGTCTAGGACCCCCAAAGAAAT 

35 CTGTGTTCCCCTTCCCTGCCCCCCCCACCCTTCCCAGAAACTGACCCCCTCCCCACAAGACC 
TGGTTTTGTAGCCTAGGGGCCCTGGCCTTCCCCCAGTTATCTTCCCCCAACCCAATCCCTAC 
TGCCCTCACTGGACTTGGGGGGTCTGGACCTTTGGCCCCTGCCCCCTGGGGGACCCAGACC 
TCTGGGCCCTCACTTCTGGCCCTTACAGAGATCCAGGCATCCAACACCCCCATCCCTGCCCA 
AGCGTCTGAGGTGTTAGTGGTGGGGGGAGAAGCCCACCATCCCAGACTCTGGTAAATGTCT 

40 TTGCTGGTTCCTTGCAGCTGGCAGTGGGGGGGACCCCAGCCCAGGCCCAGGCCTAGGCCTG 
GGGTGGGGATAGGGTCAGATGAAGAATTCCTCTTTCCTCTTGTGTCCGTCGCTGCCATTGAG 
GAAGGCTTCTCTTGCTTCTCCCTGTTCATCCAAGCCACTGGCTTCGTGGGTCAGATAGGAAC 
CTGAGGGGGTGACAGACCCCCGGGGCAGGGGGGACATATTTGTGGATCCAGGAGTTGGAC 
AGAAGTATAAGGGAAGAGGGAGACAGACAAGACACATGCCAGGCGAAGGAAGAGGGAGA 

45 AACGGAACACACAGGGAGAGGCAGAGAAAGAGGTAAACAGTGGCAGAGAAAGAGGTAAA 
AGCAGAATTAGGAAGACTCCAAAAGCTCACCGAAAGTGCCACCCTTATCCTTTCTCTTGGA 
GGTATTTCCTTGCCCTGCTCCCAGCGAATTCAGCAATTAGGAAAATAAATTGTnTATTCAA 
ATCCATGCTCl 1111 i l CCCCTAAlTriTl GTATTTTTAGTAGAAAAGGGGCTGCGCCATGGT 
GCCCAGGCTGGTCTCGACCTCCTAGCTTCTCAAGTGCTT 

50 TATCCGCCTTGGCCTCCCAACGTGCTGGGATTACAGGCGTGAGCCACCGCGCCCAACCGCA 
AATCTATGCTTTTAATTCAGCTTCTAAATTCTACCCCTTTTCGAGTATTGTGCCGAAAGCCC 
CGCCCCCTTTGTCATCTCCGCCCCCGGTGCGGCGGGATTTGGAATCCAGAGCCTAGGCTCCG 
CCCTCTCGTTACCCTGGCTCTAGGCCCCGCCTCTTTCCGAGCCCTACAACCAACCAACCGTA 
GAGTCCAGGCCCCGTCCCACTCACCCTTCTGCCGTACCGAGCACCAGACCATGCCCACTAG 
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CACACATATGATCAGAAACACCAGCAGCGCCAGGATGCCGCCCACAATGGCATAGGGAAC 
CGACGTCTGAGCCTCTACCACCGCACCAGGGTCTGCCAGAGGGACACGGCACAGGACCAG 
GTCATCAGAGGACGATCCCAGTCTGGCCCCATCGCTGCCAAGCTTTTAAGCCATTCTGCAC 
ACGTCTAACCGTGCCCmTATGTGCCACACCCCTCAAAAATTACTGCCACCTTGTAGTCTC 
5 TTCTCTTTCCAGATGCITGTTGGTTTGTACACTGCCCGACCCCTCCCCTGAGTCATGTTACAT 
TTTCCTTTTCTTTTTCTTGTTTTCTTTTGCAGAGACGGGGGTCTCACTATGTGGCCCAGGCTG 
ATCTTAAACTCCTGGGCTCAAGCGATCCTCCGGCCTAGGCCTCCCAAAGTACTGGGATTAG 
AGGCGTGAGCGACCGCACCCAGCCATCCCTTTTCTTTTGACTCAAGTTTCTTCCTCCACTAA 
GAAACAGAGTCCAAGAAACAGGTCCAAGTCCCTTCCCACCTTGTCTAAAACGCTCCAAGTA 

10 TTTAAAGTGCTGGGCCCAACTACCAAAATTTCTGCCCCACCGTCATAGAGCTAAACACAGA 
ACAGCTGTGTGCTAGAGCCCATTCCAACCACCTTACATATTTAGTTCACATAATCTTCACAA 
CAGCCTTGTTATATAGGTGCTATTGTTTATTTCCACTTTACTGATGGGTAAACTGAGGCGCA 
GACAGGTTCGGTTACCTGCAATAGAATGCAGCCAACCCGAATTTGAGCCCCGCGGGCCAGT 
CTGGTCCCAAAACAAAAAGAACTCTGTTGGCTGCCGAACCCCTGAGTTATGTGGCCTCTTT 

15 GCTCAAGCCCCGCCCCCGCCACCTGGCGCCCCGCCCCCGCCCTCAGTCGGCCGCAGCCTGC 
TCTCACCGTAGACCACAAGTACGTAGAGCGCCCTCGCATGGCCGTGCTTATTGGACGCCTC 
GCAAGTGTAGGTGCCGTTATCCGCGGATACCAGACCCGGCAGCGTGAGCGTCTCTCCCACG 
GCCTCCGCCCTCTCCGGCAAAGACTCATTCCCGCGGTTCCAGCGGATCT 
GGTTTGGCCTGGGTGGGGATAAAGTATAGTGAGAGTTAGGAACCGAGGTGCCAGCACCCA 

20 ATTCTGACTTGTCAAGAATCTAGACATGCAACTCTCATCCCGCAGGGACCTCCAAATAAGA 
GGCTTCCTGCTATCTCTTTCCTTTCTGGAAAACCAACAGTCCTGGGCCTACTTCCACCCATC 
ACCAAGGTCTCAGGAATTCTAGCCCAGGCTGAACATGGTGGCTTATGCCTGCAATCCCAGC 
ACTTTAGGAGGCTGAGACGGGAGGACTGCTTAAGGCCAGCAGTTCCAGACCAGCCTGGGCA 
ACACAGGGAGACCCCGTCACTACAATTAAAAAATAATAATAATAATAATAATAATTCTAGC 

25 CCTCCCACGCCATTCCATCCTCAGCAACCAGGAGTCTGAGGCTGCACAGCTTCAGTATTGG 
GGAGTCTGAGCCTCCAGATTCCTCCTCCCTCAGGATCCAGGAGTCCAGGTCCCAGATCCCT 
ATTCGTCCAGGTCCCCAGCTCTCTCCTCCTCAGGACCCAGGAATCCAGGTCCTAGCTCCCTG 
TTTGTCCAGGTCCTCAGCTCTCTCCTCCTTAGGACCCAGGAGTCCAAGTCCCTGGTCCCTGT 
TCTTCCAGGTCCCCAGCTTTCTCCTCCTGAGGACGCAGGAGGCCCCCAGAGCTCACCTGGG 

30 GTTCCCCGTGACAGCACACGTCAACACCAGCGTGTCTCCCTCCCTCACCACAGCTTGGGAG 
GCATGAATCCGGGCCGTGGGGGAGTCTGTTAGGCAAAAGTAAGAGGAGAGAGTAGTTTCC 
AAGCCATCACGCAGGACAAGGGGGACCCTCGCGGGTGCGGGTGGCTGGCGTTGGGATCCCT 
TGGGTCCTGGCCCGCCGGTCACTTACACTGCACATCCAGCACGTACTGCGTCTGCTTGCTGT 
GTCCGGAGGGCAGCGCCTGGTTCTGCGCCTCACAGATGATGATACCACCGTCGTCCTTACG 

35 GTCCACACGAAACCGTACTGTGCTTGCCACGCTCCAGACCTTGCCATTTTCCTGGCTGCTGC 
TCACTCCTGCCACACCCCGGTCAGACACTGTCAGGCCACAATTCCGGCTCCATCCACCCACC 
CACCCGAGCCAACGCCAAAGCAGGCTATTTGCCAAGCTCCACCCCTTACCCACAGGCCCCG 
CCTCTTGTCCTCCAAGCTACGCCCCTCCCCTAACCAAGCCCACGTGCCTCCTCCCAAAGCTC 
TTCCCTCTTTCACGCTCATGCTTTCTCGTCTATCAATCCATTTAATTGCTATATATATAAAAA 

40 CATAAATTTATATATATACTTAGAGACAGGGTCTCACAATGTTGGGCAGGTTGAACTCCTG 
ACCTCAAGCAATCCTCCCATCTCAGCCTCCCAAAGTGCTAGGACTACAGGC 
GTGAGCCACCGCGCTCGACATCAACCACTACATATTGAATGTCCAGTGTCTGTGAAAACCT 
GTGGCTCCTCTCCACATATAAACAACCTCTCCTAAGTCCCACCTCCTCCCCATCCCTTGTCA 
GCACTCGGCCCAGGGTACCTTTCAGCTCCTTGCGGTCCCGGTACCAGCGCAGGGTGGCAGC 

45 CGGACGGGACCGCGGAACGAGGCAGCTGAGCTCCACCTCGCCGCCCTCTACCGCCTGCTCC 
CGGACCTCCACCACAGGATTCTCTGGGGCCACTGCCGCAGGGAGAAGGGAAGTAAGGGGT 
TAAAGAAGGCACGAACGTGGGCTCAAAGCGATCGAGCTGCCTGTTCCCAGCGACCATAGG 
GAACCAGGGTCCCAGGTGGCAGGGGTCAAAGGGGAGAGGTCAGGAGCCAGATGCCCATCC 
AGGATGTTAAAAATAGCCATGGTCTGAAAGTCTCAGGAGAAGAGAGAAGCAGAGAAGAAA 

50 GGAGGAGAGGATGCGTCTGACAAGGGGGAGGGCGTTACCTAGTACCGTGAGCGTGGCAAT 
CTGGTGGTGGGTGTCTTCTGTGTAGAGCTGGCAGAAATAGCCCCCCTCGTCCTCCAGGCGG 
GCATCTGAGAGCCGGATCCGCACCCGGCGTGGGGAGAACTCCTCAAGCTGGAAACGCTCAT 
CCTTCAAGGCTAGAGAGAGTGAGGGGGAAGGTGTGAATTTCGGGAGTCCTGGCCTCACAAG 
TCCCACCCTTCCGACAGGAGCTTAGAGTCCAGCCCTCTGCCTCTTTTCTCCAGCCATATCTA 
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TGAGTCTGAGGTGTCCAACTATTTACTCCCTTGAGGACCCAGCATTATTCAAGTCCTCCTGC 
CTGCAGGACCAGCAGTCCGGGACCCCAGCCCTTTCTTCTCCGAGACCCAGGAGACCAAACT 
CTCAGGTGTGTCCTCTTTCAGGACATGGGAGCCTGGGCCCCAGCCCTCTCTTCCTTTAAGAC 
TCCTGAGTCTGGTCCCCAGCACTCACCACGGGTGCCATTGAAGAAGAGGGTCTGCCGGGCT 
5 GGGTTCTGGATGACAACTATGGACCCATCATACTGGTGCAGACGGCAGGTGATCTCAGCCA 
CCCCACCCTCAGCCACTGTCACGTTCTCTGTCTGTACTTCCTGTCCTGCCCCTGGACGATTA 
GACAAAGAGACAGGATAGAAGACTTACTGAGAGCTGCAATTCAATTTTTTCTTTCTCCCTCT 
TCCCCATCCAAACCTCCAATCCCTCTCTTTCCCCTCATTCATTCCATTGCACTGAACATTTCC 
TGCAGGCTAGAGTCCAGGACAGGGAGGAAATCTGCTCCCTACTCTAAAAGAGCTGCAGTCA 

10 AGATTTAGTAGAATATGCTCTAATGAGGGCAGCACAGGGCACACTAGGAGCCCAGAGCAA 
GGGAGGACTATTATAGAATTGCCTAGAGAGATGGGTAGCCAGAGAGGGCTCTGCAAGAAA 
GCTCCATTGGATCTGGATCTTAAAGAGTAAGCAGGAGGCTGAGCGCGGTGGCTCATGCCTG 
TAATCCCAGCACTTTGAGAGGCCGAGGTGGGCGGATCGCAAGGTCAAGAGATAGAGACCA 
TCCTGGCCAACATGGTGAAACCCTGTCACTACTAAAAATACAAAAAAAAAAAAAAAATTA 

15 GCTGGGTGTGGTGGTGCGCACCTGTAGTCCCAGCTACTCGGGAGGCTGAGGCAGGGGAATC 
GCTTGAACCCGGGAGTTGGAAGTTGCAGTGAGCCGAGATGGAGCCACTGCACTCCAGGCTG 
GGCGACAGAGCGAGACTCTGTCTCAAAAAAAAAAAGAAAGAAAAAAAAGAGTAAGCAGG 
AGTTCACAAGGTGTGGGAGACTGCTGTGTGTTCACCAAGCCTCATCTTTCACACCTGGGCA 
CATGTTGTAGCCCGTTTGCAAAGATAGCCGTAATATTCTCCTGTCCCTGGACATGCCCTTTG 

20 CAAGTTGATTTTGCCATTCCTCCCATTGAGAAGGCACTTTGTCCCCTACTAGTCTGGGTAAG 
CCTTGAGAGTTGCTrrGACCAATAGAATTTGCTAGAAGTGATATTGAGCCTAGGCCTGAAG 
AGGCCTTGTAGCTTCCACTCCTGCCCTAAGACTGTTGCATGAAGATACCCAGACTAGTGTCT 
TTGCAGATGAACAATCATGGTGAAAGAGAAGCCCAGCCGGCAGCCAGCACCAATCGCCAG 
CTGTGTGAGTGTGGCCATCCTGGATCATCCAGCCCCAGCTGCCCCACCAGCTGACAGCAGC 

25 CACACAAGTGACCCCAGTTGAGACCAATAAAAGATCTGCCCATCTGATACAGCCCAAACTG 
CTGAACCCCAGAATCATGAACAAATAAGGTGGTGGTTGTTTTAAGCTCCTAAGTTGTGGGT 
GATCTGTTCTACTGCTAAAGTTAACTGATACAATACATAATTAGGCTATACTTCCCAGCATC 
CTTTATAGTTAGGTGGGGCCATGTGACCAATTCTGGCCAATGGGATGTAGGTGGAAGAGAA 
ACACCTCTTGCAGCCTGAC 

30 CCATCTCCCTCATAATCCTTCACACTGGCTGAACAGAGAGGACTCCAAGGAGCCTAGAGGA 
GGGCAGAATCACAAGCCAGAAGGAACCTGGGTCTCTAACTGACTGTCCCCCATGACCCGCC 
TGTATAGGACTGTGATATGAGCAAGAAATATACCTTTTTGTTAAGCCATTGAGATTTCAGG 
GGTGTCTGrTACAGCCTTTAACCTACCCTGATTAATCCATCAGAAAAACAAGGTGGGGAAT 
CTAGAACCATCAGAGAAAAGCATTTAGGAAAGCTGAAAGCCAAGACTAATCATCAGCATT 

35 AATATCATCATCTGTTGTCTTCAAAATAACAATAACCCCCATAGCTACCAATTATTAGGTAC 
TTGCAGTGTTAGTCCCTGTGCTAAGGGCATTACCCATATAACTTACCTTTAATCCTCACAAT 
CCCTGTGTAAGGTAGACATGATTATTATCATTATTATTATTATTTTGGGACAGAGTATTGCT 
CTGTTGCCCAGGCTGGAGTGCAGTGGTGTGATCTCAGCTCATTGAAACCTCCACCTCCCAA 
GTTCAAGCGATTCTTCAGCCTCAGCCTCCCAAGTAGCTGGAATTACAGGCATGCACCACCA 

40 TGCCGGGCTAATTTTTATTTTTAGTAGAGACAGAGTTTAGCCATATTGGCCTGGCTGGTCTC 
GAACTCCTGGCCTCAAGTGATCCGCCTGCCTCAGCCTCCCAAAGTCCAGGGATTACAGGTG 
CGACCCACCGCGCCTGGCCAATTATTATTATTATTTTTAATTTGAGACAAGGTCAGGCTGGA 
GTGCAGTGGCACGATCTCAGCTCACTGCAATGTCTGCCTCCCAGGCTCGAGTGATCCCACCT 
CAGCCTCCCCAGTAGCTGGAACTACAGGTGCACAACATCACACCTGGCTAACTTTTGTATTT 

45 TTTTAGAGACGGAGTTTCACCGTGTTGCCCAGGCTGGTCTTGAACTTGCGAGCTCAAGTGA 
ACTGCCTGCTTCGGCCTCCCAAAGTGCTGGGATTACAGGCATGAGCCA CTGT GCCCGGCCT 
GCGCTATTATTATCCCCATrrTGCCCGGCCTGCGCTACTATTATCCCCATTTTCCCCCATTTC 

CATTTTTCTTTTc i 1 11 n - n - i ' iTriTrri - n 1 l i gagacattgtcttgctctgtcgcccaggc 

TAGAGTGCAGTGGTACGATCTCGGCTCACTGCAACCTCCACTTCCCGGGTTCAAGCAATTCT 
50 CCTGCCTCAGCCTCCCAAGTAGCTGGGATTATAGGCACCTGCCACTGCACTTGGCTAATCTT 
TGTGTTTTTAGTAAAGACGGGGTCTCACCATCTTGGCCAGGCTGGTCTGGAACTCCTGACCT 
CGTGATCCACCCGCCTCGGCCTCCCAAAGTGCTGGGATTACAGGCTTGAGCTATCGTGTCCT 
GCTCCCATTCCCATTTTATAGGTGAGAAAATTGGCCCACAGAGATGAAATGACTTGCCCAA 
GTTCACAGCCAAGAGTGGCAGTGCCAAAATCTTCGTCCAAATCTCTGATTCTGTATCCTGAA 
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TCTGTATATCCACTCCTGGCTGTCTGGATTAAGTGTCCATC/VTTGGCAGGGGGTTGTGAGAG 
CCGCITGTGATGGGCCTCGAATGCCAACCTAGGAGATTTGCTTTCATCCTAAGGGCCAGTG 
AAGGTTTTGAAGCAGGAATATGCCATGATTAGATCTGGCTATTTGTCTTTAAGTGCTGGATA 
ACTATCCATGTCTTITACATTCAGGTGCrGGGTTGCATTCATTCAGGAGTATTTCCTGAGCA 
5 TCACGTAGGTTTTCAGGGGCTGAGTAGTCAGAGATGAGTTAGATGAGGTCCCTGCCCTTTA 
AGATTTATGGGAAGGTAGGAACCAATCACGGTAATCAAAAGTGTTATGTGGCTGGGCACGG 
TGGCTCACACCTGTAATCCCAGCACnTGGGAGGCCGAGGTGGGCGGATCACAAGGTCAGG 
AGTTCGAGACCAGCCTGACCAACATGGTGAAACCCCGTCTGTACTAAAAATACAAAAATTA 
GCCAGGTGTGGTGGTGGGTGCTTGTAATTCCAGCTACTCAGGAGGCTGAGGCATAAGAATC 

10 GCTTGAACCTGGGAGGCAGAGGTTGCAGTGAGCCAAGATCGCGCCACTGCAGTCCAGCCTG 
GGTGACAGAGCAAGACTCCGTTTCAAAAAAGAAAAAAAAAAAAGAAATAAATAAAAGAAA 
GTGTTATGTTTTCTGTAAGAGGGTAGGTAACCTAATTTGGAAGTTGAGGGGTAGAAAAGAT 
TATTTCTGGGGGATGGAGACAGAGACTTCTGGCTTCCTATTCTGACATCCATTTTTCCCTTT 
CTCCTCAGTAAAAGAAAAGAACACTGGTTGTATTTTATGGTTGCACTATGTCCAGCAGAAA 

15 AAGGCATTCCrCAGTCTCCITGCAGCAAGGTAAAGCCATCTGATAAAATTTTGTCCAGTTGG 
ATATAAGCCAAAATGTTGCGTGACAATTTTGGGAGGACTTCCTGAAACAGGTGGACAAACC 
CTTTTTCTACTGAGTCACCTTTGTGCCACCTGGAACTAACAGTGTGACGCGTGGAATTTAGG 
CAGCCATATTGAACCATGAGGACAAGAGCAGTGGGGATGGCGGAACCAAGAGCTGGAAGG 
TGCCTGAGTCTCTGGTGAAGATGTGGAGCTGCTGTAACAGCCCTCAACTCCTAGTTCTGGAC 

20 TTCTTTTATGTTrTAGTGTAACGCmGGGTATTTTTATT^^ 

GGTCTCACTATGTTGCCTAGGCTGGACTCAAACTCTTATGCTCAAGCAGTCCTCCTGCCTCA 
GCTTCATGAGTAGCTGAAACTATAGCACTTTGGGTATrrCAGCCACTGTTTGAGGTTTTTCT 
AGCACCTCCTGGAATATCAAGCTTAACATGTCCAATCCTTGCCCCAGATATTTTCCTCCCCA 
AATTTTCTCAATCTCAATAAATGTCACCACCATCCACCTGGTTGCTCAGGTCAAAAACCTAG 

25 AAATCATTCAAGTTCTCTCCCTTTCCCTCATCCCCAATATCCATTCCATCAGCAACATCTGT 
CCATTCTACCTCCAAGACATATCCCAGATCTCATCACCTTTGTCTGCCTCTCCTACCCTCACT 
CTCATCCAGCATCATCCCTCACCTGGACTCTGCAAAAGCCTACTCGTGGGTCTGTCTGCATC 
CCTGTCTGCCTCCTCCAGGGCCATTCTCCACCCAGTGGCCGGATCGAl 1 111 CAAAGAGGTA 
AATCAGATCAATTCACCTTTCTGCTTAAAACCCTCCGAGGGCTGCCCGTAACATGTAGAAT 

30 AAAATAGAGACCCCTTCCCGGGGACTTCAAGGTGCTATATGGCCTGGCCCCTTGCTGACCT 
TACTTCACTCTGGGCTCGCTAGCCTTGCTGTCCCTCAAACATGCTGAGCTCGCTCCCACCAC 
AGGGCCTTTTCCCTTTTCTTCCTTCTGCCTGGAATGTTCTTCTCCCCACCTCCCAAGCCCCAT 
CTTCCCAGGGCTGACTCCTGTTCCCATTTGGGTCTCAAATCATATCAGTACCTTCTCAGAGA 
GGCCTTCCCTCACTGCTCATCCCTTCACCTTTAGAACACTTTCTTTTCTTTTAAGAGACAAA 

35 GTCAGCCCAGTGCGGTGGCTCACGCCTGTAATACCAGCACTTTTGAGAGGCCAAGGCGGGC 
AGATCACCTCAGGTCAGGAGTTCAAGACCAGCCTGGCCAACGTGGCGAAACCCCGTCTCTA 
CTAAAAAAATACAAAAATTAGCTAGGCAGTGGTAGCCCGGGCTACTCAGGAGGCTGAGGC 
AGAATTGCTTGAACCCAGGAGGCAGAGGTTGCAGTGAGCCGAGATTGAGCCACTGCACCCC 
AACCTGGGTGACAGAGAGAGACTCTGTCTCAAAAAAAAAAAAAAAAAAAAGAGACAGGGT 

40 ATTGCTCTGTCACCCAGGCTGGAGTGCAGTGGTGCAATCATGGCTCACTGCAGCCTCGAAC 
TCCTGGGCTCAAGCCATCCTCCCACCTCAGCCTCCTAAGTAGCTGAGATTATAGGCTCCTCC 
CACCACACCTGGCTAATTTTTGTGCTTTTTGTGGAGACACAGATTCTCCATGTTGCCCAGGC 
TGGTCTCCAACTCCTGGGGTCAAAGGATCCTCCTGCCTCGGCTTCCCAAAGTGCTGGGATTA 
CAGGCGTGAGCCACTGCGCCTGGCCCAGAACACTTGCTATTTCCTCACCATTGCTTTATTTC 

45 TTCTATGAAGATTTCACTGGAA 

TTATCAGATTAATTTGCITATTTGTTTACTGTCrGTTTGTCACCCATGACTGGAATGTATACT 
CTAGGAAGGCAGGGATATAATCCAATGGGTTTACTGCTGCACCCCTAGTACCCAGAAGAGT 
GCTTGGCACCTGATAAGTGTCTGGGGAACTTGCTACATGAATTACATGTGTCAGATGGGAT 
ATCTGTTCGTCTTTCTTCTCTCTTTTTTCTTTCTCTCTTTCTCTCTCTCTTTCTTTCTCT^ 

50 TCTTTTTTCTTTTTrrGAGATAAGGTCTCGCTCTGTCACCCAGGCTAGAGTGCAGTGGTGCA 
ATCATGGCTCACTGCAACCTTGAACATGTGGGCTCAAGCGATCCTCCCACCTCAGGCT ACC 
AAATAGCTAAGACTACAGAGGTGCGTAGCTATGCCCAGCTAATTAAAAAAAAAAAAATTTT 
TTTITITITTTAGAGATGGGGGTCTCAATATCTTGCCCAGGTTGGTCTTGAACTCCTAGGCT 
CAAGCAATCCCCCTGCCTTGGCCTCCCAAAGTGCTGGGATTATAGGCATGAGCCATTGCAG 
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CTGGCCCAGACAGAATCTCATTTCAGCCCGACAACTTTGTGACATCATTATTTTCATCTTAA 
ACACCTAGGTTGATCCCAGCTCAACCACTTGCCATCTGTGTGACCTGTGGGCAAGTGACCTT 
ACCTTTCGGAGCCTCAGTTGCCCCATCTATAAAATGGGAATGATGCCAGTGCCTGCCTCATA 
AGGATGAGCCCCGCTCCTGAAGCTCAGGGAGCCCTCTCTGCAAGGCTGTTTTAGTGCAACC 
5 TCCGGAAACATGCCCATGCATGTGAAAACTGGCATGCACATTCTGGTGCTTTTAAAAACAT 
CTCGAAGCCTATCCACAGATCCTGGACCTCAAGACTGGTTCAGTGCTAGCCCCCCATTTTAC 
AGATGTGGAGAATGAGGCTTAGCGGGTCCCAGGCAAGTCAGTGGCAAAACTCACCATCTCC 
TGGGAGCCATCAGGTTCCTCTGGATCTGCCCCCACCAAATTTATCCCCTGCTCTCTGCTTGA 
GGGTGCACATGGGGTGAGGGTGGGGGTCTTTTGTTTTACTCCCTCCCCCTCCTGAGGAGTCA 

10 GTAACCAACAGTGTCTGTGCCTGGAATATTAATGTCTCAGCAGCTTTTGTTTGGGGGGTTGG 
GGGTGGTGGGGGCGGGACTTTCTGGTCAGAGAGGGGCTGAGCTTTGGGGACTGAGGCACTG 
GCCCTTTAAACTGTGTTGACAGCCAGGAGTCGTCATGGGGATGGTGCTTGGAAAAGGGGAC 
AGGGAGGGTTTGGGAAAGAGTGGCGGAGCAGGTAATGCGTAAGACCCAGGAATCCAGCCC 
CCAACTACCTCCTCTCCCAGGACCCAGGAGTCTAGGCTCCCAGC 

15 CCCTCCTCCATCAGGTTCCAGGAGTCTGGAACCCCGGCTTCTTTCCGCCTTAGACCCAGGAA 
TTCAGCCCCCAACCACCTCCTCTCTCAGGTTCCCGAAATCCAGACCCCTAGCCCCCTTCTCG 
ATCAGGACCCAGGAGTCTGGGCTGTCAGCAGCCCCTTCCTTCAAACCTAGGAGTCAGAGCC 
CCCAGCCCTCTCCTAGCTTAGACACAGGAGTCTGGGCCTCCAGCCCCCTCCTCCTTCAGGAC 
CCAGGAGCCAGGGGTCCAGAGTACACAGCTGGTGGATGTTTCCACGGAGACTAAGCAGGG 

20 TGGGGGGAGCGCTTCCTGGGTCCTGAGTCAGCGAATACCCAAGGGAGTCTCAAGGTCATAG 
TTCCGGGAAGGTCACCACCACCCCCTCTGTATCCGCTCCCCAGGGGGCTCCTGGCATCCTGC 
CTCCTTCCCCCTTCCTCCCTTAGGGAGGTGGTACATCCCTGCGTCCTGACTGAACCCCCCTC 
AGCCCCCCATCAATGGCGGAGTCCGAACATCCTCGCACAAAGCGTCAATTCTTCCCCAGCT 
CAGCCTTGTGAAGGCGCCTGTATTCGCAGGACCTAGGCGTCAGGGTCTCAGCCCCTCCTCC 

25 CTCAGAAACCTGCAGTGGAATCCCCCGCCTCCAGCCCCTTCCTCCCTCAGGACCCAGGAGT 
CTGTATCCTCATCCCTTCCTCCCTCAAGACCTAGGAGTGTGGACTCCCAGCCCCCTTTTCCT 
TCCGGACACAGGAGTTCCAGCCCTCGGCCCTCTCCTCTCTTAAACCCAGGGGTCTAAGACC 
CCAGCCTCCTCCTCCCTCAAACTCAGGAGTCTAAGATCCCAGGCCCCTCCTCCCTCAGACTC 
AGGAGTCTAAGATCCCAGGCCCCTCCTCCCTCAGACTCAGGAGTCTAAGACCCCAGGCCCC 

30 TCCTCCCTCAGACTCAGGAGTCTAAGATCCCAGGCCCCTCCTCCCTCAGACCCAGGAGTCTA 
AGACCCCAGCCCCTCCTCCCTCAGACTCAGGAGTCTAAGACCCCAGCCCCTCCTCCCTCAG 
ACTCAGGAGTCTAAGACCCCAGCCCCCTCCTCCCTGGACCCAGGAGCCTAAGACCTCAGCC 
CCCTCCTCCTTGAGACCCAGGAGTCTAAGACCCTAGCTCCCTCCTCCTTTAGACCCATTAGT 
CCAGGCCCCCAGACCCTCCTCCATCAGACCCAGGAGTCCAGGCCCCCAGCCCCTCCTCCAT 

35 CAGATCCAGCCCCTCCTCTCCTGAAAACTTTTGACTCTAACTCCCCAGTCCTCAACCCCTAG 
AAGCACAGTCCTGCCTTTCCTCAATCCTCTGTCCCCTCCCATCTGGGGACCTAGGCATCAGG 
TGGGGGCGTAGGGGTGAGTCAGCAACCTCACACACAAAGTCCCCGCTGTGGCCCCCACATT 
CCTGGGATATTCGGGACTCCCTGGATTCCAGGCCTCAGGCCCAGCCAGGGAGTGGGG 
AGTCCCCCAGAGGTCCTCCCTGGGTGTGGGGTACGAGAGGAATTCCTGCTCCGGGAAGGGT 

40 GCAGGCCTGCACTGAGCTCCCTCTGTCCGAACCTCCACGCCCAGTGCCCTCTATTCACCCCC 
TCTTCCCAGAAGAGCCCAGGCTCAGCACCTGCCCCTTGCCCCACTGGGTGCCCACGGAGGA 
GCCTGCGTGCCTGCTCCCTATGGGCCTGGGGTCTGCACAGGCGGAAATCAGTGGGTGCTTC 
CGTTCTGATGCCACAGGCCATTGGATGCTGGCGGGTCTGACTGTCTCCAGGCCACCCCCCA 
CCCCTCCCAGAGAGAGAAAGCTGCCTTTGTGTTCTCCAAGATGGGGACAGGCCAGGCTCGC 

45 ACGACATTAACCCAGCCTTAGGCCCCAGCCCTGCTGTGTCTAAGGTCTTGGAATCCACTGC 
AGAACCTGACCCCCACCCCCAGGCTCTGGGGACACAGGCGCCTGGCTCATGGGTGGGTGGG 
TGGGGGGGTCAGTGATAGAAACCTCCAAAACCTGTTCCTTGGGGTGACTCACAATGGAGGG 
AGGGTCCCCCTATTCTCAAGAGTGGCTGGTCAGAATTTTAGCAGGAAAAAGTGAGTCACCC 
TGGGAAGGAAACATTATTrAGGGACCAACAACTGCCCCCTCCACAAGACCCCTCAACTCCT 

50 AATAGCCTCrCTATTCTTTCTTTGTATTGGATATCTGTTTCCrCTCCTCCTTTCTGTTCTACCC 
AGTTTCTGGCTGCGGGTCCCATTTCTGCCTGGGTGCATCCCTGGGCAGGCAACCCATCCCTC 
CCTCTTGCTTTCTCTCCTCTGCCCACCCTGGATCCTTCTTTGGGC ATAAA TCTCATCTTCTTC 
TGCTATGCTCAGAAGATGAATGAACCAGGAGAGAGAGAACATGTTTTTAAAATGGCGCAA 
ATGCACCCCATCTCCCCCGATTCCTGCTGGCTGGGCAAGGTGAGAGAGGAAGAAGTGACTA 
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AGAGAGAAATGTGGGAACAACAGATACCCCCTAAAATGTGGTAGCCAAGGCCACTGAGAA 
ATATCCAATGGAAAGGAGAGCAGGAAGGGCCCTCCAAGACCACATGCTACAGCCTCCTACC 
CCATGCTTTACAGAACGGGAAAGTAAGGCCCAGAGAGGGACAAGGACTGATGCAAAATTA 
TACTAAAGGGTCCTGGGTAAGGCTTGGACCCAAGTTCCTTAGCTCCCAGCTGAGAGCTCTT 
5 CCCATGACACCAAGCTCAGTTTCTACTGGTAAAAGCCACATACTATTTACTTTAGAGAAAG 
TTTACAGAGAGGGTTAGGGTGCCAGGAAGCAGTGACTTGGAAATCAAACGAGGGACAGGG 
CTGTAGACCTAACTCCCAGAAGCACCAGAGAAAGGCTTTTGCACGGGGCGGGTGGTCACCT 
TAAGCTATATTCTGATCCrGAGAATTCAAAGTCTGATGATTCTAAGCTGTCAGGATTCTAAA 
TGTCATAGATGTCAAGATCCAGGAACTCCAAGACATCAAGATTrTCACGATTTTTAAGACGT 

10 CAAGATGCTAGCATGCTAACACCATCACGGTTCTAGAACTTTAAAGGTGTCAAGATTCTAA 
AGCCTTCTGGATTCTAGAATCCrGTAGATGTCAGCATTCTAAAGTACCATCAGGTTCrTTAT 
TTACTGGATTCATTAGTTCCAGGATTCTATGAGCCTGGTGTTTAGCCTAAAAAATAAAGATA 
AATTAAAATTGATGGAAATGTCACTGAGGTACCAAAGTTCTCATCTGGGAAATTGTGGCAT 
GTCTGTTGTAAAGAAAGGAGGTAATGATGCAAGTTCTAAAGCAGTCACAGAAGACTAGAG 

15 AAGAAAGAAAGACAGTGAGAGGACAGCTTTGCCCCTCATCCTGGCCGAGGTGAGGATGGC 
TCTGCCTCAAACCCTGGAGTGGGGAACATGTAACCGCACTCAAC7TGCCAGAAACCCCTTC 
ACGGTCTGAGCTGGCGTTCCCTTTCATGTCACTGAGTTCAACATCCTCACTTTACAGAAAGA 
GAAACAGAAGCCTGGAGAGAGGAAGGTGTTTACCATTGGCTGCGATGGCAAATGGCAAGA 
GCCAAGATTTAAGCCCAGGCCGCCAGCCCCATGCCACCTGGTTATAACTCCTCTCACCAAT 

20 CTCTGCCGAACACCCAGCCCTCCTGCTTCTGCCTAGCCACCTTCCAATCCTCTGTTCCTTCC 
AAAAGTGGCCTTATCCACCAGGGAGGGGTGACCCGTGGCAGGTTCAAGACTTACACAGTGT 
GAGAGTGTGTGTGGGTGACATTTCCTGACCTTGTCCCCATTCTCAGGGTCACCCAACCTCGG 
GGGTCTCCAGCTTCTCACAGTGTGTGATGAGGGTATGTGGATGGCTCCCTGGATGTCCTGG 
ACAGGGGCTTCTCTGTGAGTCAAGCCTGGGTGTGTGAATGGGTGAGCAGGGTTTGGAGAGG 

25 CATTCGCTGAATCCACGTGTGTGCCTACACGCCAAGGTCCCCCATTCTCACTTCCCCACACA 
CATGCACACAGATGTTCCCCTCCAGGGCTCTTTAGAATGCCCTGCCTGACTGAATTCCTCTT 
CAGGGGCACAGAGGGATAGAGAGAGGGAGGAAGGTAGGATGGGAATGGGAGATCCCGGG 
ATGGAGGCTGTAAGCGTAGAGAGAGGAGGCACAGCAGAAAGACAGGGATGGAGATAGTGG 
GACAGAGAAGGGGGAAAGAGACAGGTGACAGAAAGGGTTAGAGAAACGAGTGACAGAAA 

30 GACAGGGGACAGAGACAAGGGGATGGGGCAGATAGGGGACAGAGAAAAAGGGACAGAAA 
AACAAGGGTGACAGCGAGACAGAGACAGGGACCAAGAATAGGGGCAGAGAGGGAGGGCA 
GAAATCCGGGGGAAAGAGAATAGACAGGATGATGGAGGGGACAGAGTGACCCAGGAAAA 
GGGGACAGAGACCAGGGGACAGAGGTAGGGGACAAAGACAGAATAGATGAGGAACACCG 
AGGCAAGAAGAGAGGGAGACAGACAGAAGGAGGGACAGGACTTCGAGACTGAGGGATAG 

35 AGGACAAGGGTAGGGGGACGAGGAGCCAGACGGGGGGGTTCAGAGACGGGCGGACAGAG 
GGACGCAGAGACTGGACAGAAGGACAGCGGGACCGGCCTGGGGAGGGCGGACTTGTGTGT 
GTAGGGGGGTCTCGGGCCCTTTGTCCCCGCCGGGATCCAGCCTGCGCGGGTGGGGGGGCTG 
CGGCACGGCGGCCGGGCCCCGCGCCCCCTCCCCCGCTCGTCGCTCCCGGCTCCCGGCCCGC 
GCTGCGCTTTGTCCCGGGGAGGGGGCCCGGCCCGGCCCCGCGCGCATTGTTCGGCCTCTGC 

40 GGCCCCGAGGCTGCCGGGCTGTCACCACAGCGCGCCCCCCGCCCCAGCCCGGCCGGCCGAC 
CCCGGCCCCCGACCCTACCTGGCCCCGCCGCGGCCGCCCACAGCAGCAGCAGCGGCCACTG 
GAAGCGCCGGGCCCGGCCCATGGTGCCGCCGCCGCCGCCGCCGCCGCTCGCTCCCGGCCCG 
GCACCTGCACCGCCCGCGCCGCCCGCCCCGCCCCCCGCGCCCCGCCCCCTGCCCGCCCGGG 
GGCGGGGCGCCGAGGCCGGGGCGGGGCCGGGGAGGGGAGGGGGAGACGGAGGAGAGGCC 

45 CGGAGACAATCGGGGGGACGGCACGGTGGGGGAACGGTGCGGGGTGCGAAAGCTGGAGAG 
GAGAGGGGTGAGGAGGGCGGGAAGGGGTGCGCGGGAGGGCGACAGCGGCGTGGGAGCAG 
GTGGGGGATCTCGGTGAGCGCGGGAAATGGAGGGTGTTGGGTGAGGGTGCTGCGTGCGGG 
CCCAGGTGCTGCGCGCGAGGGTGCGGAGTTGCTGGCATGCAGGGTGCTTGCGCTGCGCGGA 
GGGGAGGGTGGCAGGGTGTTGCTGGAGGCTGTGCGAGGGTGGGGGCGCGGGCGTCGTGGG 

50 GTGCGGTGTGTGCGAAGGGAGAGCGTGGCCAGCGTGACGGGGGAGCGTAAGGGAGGGAGT 
GCGACGTGGGAAAGGTGAGTGTGAGAGGCGTGCTGCGGGCAGGTGGGTGTCTGGAGTCTA 
GCGAGAGGCTGTGAGCTGAGCCACCGGGACAGGGGAGGCTGCAGCTGGAGGTCCGGAGGG 
TCCGGAGGTCGAGGCAGGTCAAGGATCTCCCAGGGCAGGGCGAGGCTGGGGCTCAGGAGT 
GGGGTGGGGTCAGTTCCCTCCCTCCCTCTCTCCTGTCCTGACCTGAAAACCCCGTGTTTCCG 
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CGTCATTCTCCGGGAGGGGCCCCCTGAAAGTGAACTAACTGGAAGGAAGCCTGAATCCTGG 
GTCCCAGGAGGGAGAGGCTCCTGTGAACACCTTCCAAGCCCTGGCGTCCCCTCTCCTCCCT 
GCTGTCTCCCTGCCCCAGCCTCTCTCCCTCTCTCTGCATGTATTTGCCTCTGCCCTTCCTCTC 
TCCCCATCTTTGAGGGTGACTCACCCCTCCAGACTTAGGTCCCTT 
5 CTCCCTCCTGGGAGTGGGTTTCCCTGAGCCCACTTCTGTGACACCCTGTAGACCTGATGCGG 
GATCATTACCTATGGGACCCAGAAAGAGTGAGAAACCATGGAAAGAAGGCCTCGACCTCTC 
TCATGCCCATTTGTCAGGCAAACTGAGGTCCAGAAGTGCCAATTATGAACATCTTTCCTTCC 
CCCCTCCCCCCTCCCCGCCCAGACGGAGTCTCGCTCTGTTGCCCAGGCTGGAGTGCAGTGGC 
ACGATCTCGACTCACTGCAACCTCTGCCTCCCAGGTTCCAGTGATTCTCCTGCCTCAGCCTC 
10 CCGAGTAG CTGA GATTACAGGCGCCCGCCACCATGCCTAGCTAATTTTTATATTTTTAGTAG 
AGACGGAGTTTTGCCATGCTGGCCAGGCTGGTCTTGAACTCCTTACCTCAGGTGATCCATCT 
GT CTGGC CTCCCAAAGTGCTGGATTACAGGCGTGAGCCACCATGCCTGGCTGAAAATCCTT 
ACTTTTTATTCCGACTAAAAAATTTTACATCCAGTCCCACAAGGGACTTCAGCTTCACACAC 
CCTTTCTGTCCTCAGTACCCAGCTCCCAGTATCCTTTCTGACCTCAAAACCATAGCTACCAT 
15 CAACCCTTGTGTCCCAGGACCATGGCTCCCAGTGTCTTCTCTGTCCTCAGGGTCCAAGCTCC 
CATCAACTCCTGTGTCCTCAGGACCACGGCTCCCAGCATCCTCTCTGTCCTTCAGGTCCAAG 
CTCCCATCAACCCCTGTGAAGCAGGACCATGGCTCCCAGCATCCTCTCTGTCCTCAGGGTCC 
AAGCTCCTATCAACTCCTGTGTCCCCAGGACGATGGCTCCAGCAATCCTCTCTGTCCTGAGA 
GCCCAAGCTTCTAACTGCCCCTGTGTCCCCAGATCCATAGCCCTGAGCAACTTCCTTCTTTT 
20 TCAGTCCTCAGCTTCCCAGCTTCTGTAGACTTGGGAAGAGATAGTCTCTAATCCTCTTTCCA 
GGGCTCACATTCTGTGACTTTTGCTAGATGGGAGAGGAATGTTTGATCTGCCTTTGGAATAC 
TGGTCCAAGGGGTAACTAGTAGTTGCCTTTTCCCGCAGGAGCCAATAGGCCCGCTCACTCT 
GTGCTCTGACAGATGTCTCCTGCTCCAGCTGAAGGGGAACCTTGGGAGATGTTGGTTTGGTT 
CTCACCTGTCATCCTTAAGTCCCACCATTCCATGTGAAGACATCACAAGAGTAGTGGTCCTG 
25 ACGGGCGCGTTGGCTCACACCTGTAATCCCAGCACTTTGGGAGGCCAAGGTGGGCCGATCA 
CTTGAGGTCAGGAGTTTGAGACCAGCCTGACCAACCGGCCAACATGGTGAAACACCATCTT 
TACCAAAAAAAAAAAAAAAAATTAGCAAGGCGTGGTGGCACGTGCCTGTAATCCCAGCTG 
GTCGGAAGGCTGAGGCATGAGAATCCCCTGAACTTGGGAGGCAGAGGTTGCAGTGAGCTA 
AGATCATGCCACTGCACTCCAGCCTGGGTGACAGAATGAGACTCAGTCTAAATAATAATAA 
30 TAATAATAATAATAATAATAATAATAATAATAAATAGAATAGTGGTCCTGTCCCCATCCTA 
CTTCAGGGTACCCTGTCCATTAGGGATTTAGTGCAAGTGACAGCAAGTGCAACCCAACTGG 
TTTGAGAGAAAGAGAACTGGTTCACACATAACAAAAAGTCCTTCTATGGCTGGCTTTGGCG 
AGGTCTGTCAATCTCTGTCCTAAGGATGCATGGCTCCCCTCCTGTAGCAAGATGGCTGGCA 
GATACCCCTGGGGCCAGATTCATATTTGGGGTGATTAAGATTCTGCAAGAGAGAGACAACC 
35 TTTATTTCACACAGCTTTTCAATTGTTGCCTGTCCCTGGTGAGACTCGGAGACCTAGCTCTT 
GCCTGGTTTCTAAACTTTCAATAACACCGTTTTTGCTTAAGTCAGCACAAACAGATTTTATT 
TCTTGCAAGCAAAGATTCCTGAACAACAACTTCAGAGCCGTTAACAATGAGGTCCTGATCA 
CAAGCTATGGTATAGGACGTGAGAAATTTGTCCCTAGCCTCAATATCTGCTGGAGGGCATC 
ATGGAATAAGTATTTCTATCCTCTGATCCCCACTGTAGGGCATCATGGGATATATAATCCTA 
40 ACCTTCAATCTCTGCCATAGAGTTTCATAGGCAATGCAGTCCTAGCCTCAATATGTTGTAGG 
GAATTATGGGAAAGGTGAAATTATCCTCAATTATAATACAGAGCATCTCAGAAAATGTCGT 
TTTAGCCTCATCTCrGCTGTAGGGCATCATGGGAGATATACTTCTGGCCCAATTTTTGTTGT 
AAGTTGCCAT^GAAGATGCAGTCTTT 

'l"iri"i"l"rril"riATTATGTAGAGACAGGGTCTCTCGCTATGTTGCCCAGGCTGGTCCTGAACT 

45 CCTGGGCTCAAGCAGTTCTCCTGCCTTGGCCTCCCAAAGTGCTGGGATTACAGGCAAGAGC 
CATTGCACCCAGTCCCTTCTCTCCTTTCTTTCTTCATCACCTGCCATATTCCAGGCACTAGGA 
ATAAATCATCAAGTAAATAAACGGCCTTACCCTCCCTGGCAATTATAATGGGGAAAGTTAG 
CTAAAAACAAACAAAAATTACTGTTCCATTTAACCATCGCTGAATAACAAAATACCCCAGA 
ACGTAGTGGTGTGAAACAACAAC(nTTTAATTTTATGATTCTGTGAGTCAGGAATTGGAGC 

50 AGGATTGGTGTGTATCTGCTTCATGATGAACTGGAGCCAAAAATGAACTAGCTGGAACAGC 
TGGAGATGGAGGGGAGGGGCATCAAGGGCCATATATCTAAGGCTGGTGGTTGGTGTTGTGG 
GTTTTGAATAGTGTCCTCCAAGTAAAATATATGTTGAAGTTCTAGCCCCTGGTATCTGTACA 
TGTGACCTTATTTGGAAATAAAATCTTTGCAAATGTAATTCAC 1 1 M J I GTTTGTTTGTTTGT 
TTGCTCGAGACTGAGTCTCGCTCTGTCACCCAGGCTGGAGTGCAGTGGCATGATCTCGGCTC 
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ACTGTAACCTTCACCTCCTGGGTTCAAGCGATTCTCCTGCCTCAGCCTCCCAAGTAGCTGGG 
ATTATAGGCACGTGTCACCATGCCCAGCTAATTTTTGTATTTTCAGTAGGGACGGGGTTTCA 
CCATGTTGGCCAGGCTGGTCTCGAACTCCTGACCTCAAATGATCTGCCACCTCAGCCTCCCA 
AAGTGCTGGGATTATAGGCATGGGGCACTGCATCCTGCCCA GATGTGA TTA ACTTCTAACC 
5 CCTGGTATCTTTGCATGTGACTTTATTTGGAAATAAGGTGGG'rri^-lMM CTTG ri I'l l ri rri 
TTTTTTTGAGACAGTTTCACTTTGTCGCTCAGGCTGGAGTTCAGTTGCATAATCTCAGCTCA 
CTGAAACCTCTGCCTCCGAGGCTCAAGCGATCCTCCCGCCTCAGTCTCCCGAGTCACTGGG 
ACTACGGGCAAGCGCCACCACACCCGGCTAATTGTTGCAGTTTTTGTAGAGATGGGGTTTT 
GCCATGTTGCCCAGGCGGTCTCCAATTGCCACCCTCAAGCAATTCATCCGCCTCGGCCTCCC 

10 AGAGTGCTGGAATTATAGGTGTGAGCCATGGCGCCCGGCCAGAAAGTCTTTGCAGATTTAG 
TTGAATTAATGACTAAATGTTTCCATGCTGAGTTAGAGTGGGCTCTAAATCCAATGATTGAT 
ATGGGGTTATAAGGAGAGATATTTGGAGACATAGCCACAGTCCCAGGGAAGGTGGACATT 
GGAAGACAGAGGTAGGGATTAGAGTGATGCAGCTACAAGCCAAGGAATGGCA AAGATTGC 
TGGCAGTCCCTCAGAAGCAAAGGAGAGGCAAGGAAGGGTTCTTCCCCTGAGACTTTTTTTT 

15 TTTTTTTTGAGACGGAGTCTCACTGCTGTCAGCCTCAGCTGGAGTGCAATGGCGCGATCTCG 
GCTCACTGCAACCTCTGCCTCCCAGGTTCCAGCAATTCTCCTGCCTCAGCCTCCCGAGTAAC 
TGAGATTACAGGCACCCGCCACCATGCCTGGCTAGTTTTTGCATTTTTAGTAGAGATGGGAT 
TTCACCCTGTTGGCCAGGCTGGTCTCGAACTCCTGACCTCAGGTGATCCACCCGCCTCGGCC 
TCCCAAAGTGCTGGGATTACAGGTGTCAGCCCCGGAGACTTTAAAA GCATG GCTCTTCCCC 

20 TGACGCTTTAAAAGCGTGGCTCTTCCCGTGAGACITCAACACCTTGGTTTTGGACATTTAGC 
ATTCAGAACTGTGAGAGAACAAGTTTCTAGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTG 
TGTGTGTGTGTGTGTATGTGTTTTAGACAGAGGCTCATTCTGTTGCCCAGGCTGGAGTGCAG 
TGGTTCAATCTCGGCTCACTGCAAACTCCGCTTCTCAGATTCAAGTG ATTCTTATGCCTCAG 
CCTCCCAAGTAGCTGGAATTACAGAGGAGCGCCATCACAGCCGGCTA n i i i i i i i i i 1 1 i i 

25 TrrGTACTTTTAGTAGAGACAGGGTTTCACTGTGTTGGCCAGGCTGGTCTCAAATTCCTGGC 
CTCAAGTGATATGCCTGCCTTGGCCTCCCAAAGTGCTGGGATT ACAGGTGTAAGCCAC CAC 
ACCTGGCCTAAGTTTCTGTGTGTGTGTGTGTGTGTTTTGTTTTGrrrri 1 Tl 1 I 1 1 11 I IGAGT 
GGAGTCTCGCTCTGTTGCCCAGGCTGGAGTGCAGTGGCATGATCTCGACTCACTGCAAGCT 
CCGCCTCCCGGGTTCACGCCATTCTCCTGCCTCAGCCTCCCGAGTAGCTGGGACTACAGGCA 

30 CCCACCACCACGCCCAGTTAATTTTTTGTATTTTTAATAGTGACAGGGTTTCATCATGTTAG 
CCAGGATGGTCTCGATCTCCTGACCTCGTGATCCGCCCGCCTCAGCCTCCCGAATTGCTGGG 
ATrACAGGCATGAGCCACCAAACCCGGCCAAGTTTCTGTGGTTTTAAGCCACCTTGCTTGTA 
AGATTTGTGTGTGTGTGTTTTTAATTTTTTATTTT TAAG TAT T^^ 

TATATTTACAGGACATATGTAATATGGTTTTGGGTTTTAGTGl I i i i n 1 i iGGAGACAGAG 
35 TCTGGCTCTGTTGCCCAGGCTGGAGTACAGTGGTGGGATCATGGCTCACTGCAGCCTTGAC 
CTCCCGGGCTCAAGGGATCCTCCTGCCTCAGCCTCCCATGTAACTAGGACCACAGGCATGC 
CCCACCACATCCAGCCAA n rr i 1 1 l l ATTrTTAGTGGAGATGAGGTCTCACTGTGTTGCCC 
AGGCTGATCTTGAACTCCTGAGCTCAAGAGATCTTCCTTTCTCACCCTCCCAAAGTGCTAGG 
ACTACAGGCATGAGCCACTGTGCCTGTCCTTCCATGATGTTTTGATATAGGCACACAATGTG 
40 TTAGTTTATAAAGTTTGTAATAATTTATCACAGGCAGCCCTAGGAAACTAATATAGCCAAG 
TrTCCTGTTTCTTCTCTATATCACATCTGCTGGGGCTACATGTCCAAGGTGGCTTCTTCACCC 
ACTTGTCTGGTGCCTGGGCTGAGATGGCTGAAACATCTGGGGCTCTATCTCCAC ATGGC ATT 
TATACATGAGTAGCTTGGGCTTCCTCACAGCATGGTGGTCTCAGGGCAGTAGTAcriiiACA 
TGGCAACCAGCTTCCCCAGAGTGAGCGTTCTAAGATTCAGAAAGTGAAAAATGAAAGTTTC 
45 TTAAAACTTGGTTCCAGAACATAGCACAGCAAAACTTCCACCACATTCTACTGGTCAAAGC 
AGTCACAGAGTCACTCATATTCAAGAGGCAGAAGTACAGACCTCACTTCTTTAAGCCACTA 
CAGTGACAGGTGGTGATATGTCATTAGAGAAAGCCCTAAACA AGAA CCTTGTCCCTCACCT 
GCCCCCAAATACCATGGAAGATGTCrrrrrnri 1 1 1 1 m 1 1 1 1 1 1 IGGGGATAGTCTCACT 
GTGTCATGCAGTGGTGTGATC 

50 

SEQ ID N° 57 >gi|l84426|gblM85289. 1|HUMHSPG2B Human heparan sulfate proteoglycan {HSPG2) 
mRNA, complete cds 

GGCCGGCGAGCGGGCGGCTGCGGGCGGCGCGGAGCGGGCGGCGCGGAGCGAGCGAGCGA 
GAGAGCGGCGCGGGCCGGGCCATGGGGTGGCGGGCGCCGGGCGCGCTGCTGCTGGCGCTG 
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CTGCTGCACGGGCGGCTGCTGGCGGTGACCCATGGGCTGAGGGCATACGATGGCTTGTCTC 

TGCCTGAGGACATAGAGACCGTCACAGCAAGCCAAATGCGCTGGACACATTCGTACCTTTC 

TGATGATGAGTACATGCTGGCTGACAGCATCTCAGGAGACGACCTGGGCAGTGGGGACCTG 

GGCAGCGGGGACTTCCAGATGGTTTATTTCCGAGCCCTGGTGAATTTCACTCGCTCCATCGA 

GTACAGCCCTCAGCTGGAGGATGCAGGCTCCAGAGAGTTTCGAGAGGTGTCCGAGGCTGTG 

GTAGACACGCTGGAGTCGGAGTACTTGAAAATTCCCGGAGACCAGGTTGTCAGTGTGGTGT 

TCATCAAGGAGCTGGATGGCTGGGTTTTTGTGGAGCTCGATGTGGGCTCGGAAGGGAATGC 

GGATGGTGCTCAGATTCAGGAGATGCTGCTCAGGGTCATCTCCAGCGGCTCTGTGGCCTCC 

TACGTCACCTCTCCCCAGGGATTCCAGTTCCGACGCCTGGGCACAGTGCCCCAGTTCCCAA 

GAGCCTGCACGGAGGCCGAGTTTGCCTGCCACAGCTACAATGAGTGTGTGGCCCTGGAGTA 

TCGCTGTGACCGGCGGCCCGACTGCAGGGACATGTCTGATGAGCTCAATTGTGAGGAGCCA 

GTCCTGGGTATCAGCCCCACATTCTCTCrCCTTGTGGAGACGACATCTTTACCGCCCCGGCC 

AGAGACAACCATCATGCGACAGCCACCAGTCACCCACGCTCCTCAGCCCCTGCTTCCCGGT 

TCCGTCAGGCCCCTGCCCTGTGGGCCCCAGGAGGCCGCATGCCGCAATGGGCACTGCATCC 

CCAGAGACTACCTCTGCGACGGACAGGAGGACTGCGAGGACGGCAGCGATGAGCTAGACT 

GTGGCCCCCCGCCACCCTGTGAGCCCAACGAGTTCCCCTGCGGGAATGGACATTGTGCCCT 

CAAGCTGTGGCGCTGCGATGGTGACTTTGACTGTGAGGACCGAACTGATGAAGCCAACTGC 

CCCACCAAGCGTCCTGAGGAAGTGTGCGGGCCCACACAGTTCCGATGCGTCTCTACCAACA 

TGTGCATCCCAGCCAGCTTCCACTGTGACGAGGAGAGCGACTGTCCTGACCGGAGCGACGA 

GTTTGGCTGCATGCCCCCCCAGGTGGTGACACCTCCCCGGGAGTCCATCCAGGCTTCCCGG 

GGCCAGACAGTGACCTTCACCTGCGTGGCCATTGGCGTCCCCACCCCCATCATCAATTGGA 

GGCTCAACTGGGGCCACATCCCCTCTCATCCCAGGGTGACAGTGACCAGCGAGGGTGGCCG 

TGGCACACTGATCATCCGTGATGTGAAGGAGTCAGACCAGGGTGCCTACACCTGTGAGGCC 

ATGAACGCCCGGGGCATGGTGTTTGGCATTCCTGACGGTGTCCTTGAGCTCGTCCCACAAC 

GAGGCCCCTGCCCTGACGGCCACTTCTACCTGGAGCACAGCGCCGCCTGCCTGCCCTGCTTC 

TGCTTTGGCATCACCAGCGTGTGCCAGAGCACCCGCCGCTTCCGGGACCAGATCAGGCTGC 

GCTTTGACCAACCCGATGACTTCAAGGGTGTGAATGTGACAATGCCTGCGCAGCCCGGCAC 

GCCACCCCTCTCCTCCACGCAGCTGCAGATCGACCCATCCCTGCACGAGTTCCAGCTAGTA 

GACCTGTCCCGCCGCTTCCTCGTCCACGACTCCTTCTGGGCTCTGCCTGAACAGTTCCTGGG 

CAACAAGGTGGACTCCTATGGCGGCTCCCTGCGTTACAACGTGCGCTACGAGTTGGCCCGT 

GGCATGCTGGAGCCAGTGCAGCGGCCGGACGTGGTCCTCGTGGGTGCCGGGTACCGCCTCC 

TCTCCCGAGGCCACACACCCACCCAACCTGGTGCTCTGAACCAGCGCCAGGTCCAGTTCTC 

TGAGGAGCACTGGGTCCATGAGTCTGGCCGGCCGGTGCAGCGCGCGGAGCTGCTGCAGGTG 

CTGCAGAGCCTGGAGGCCGTGCTCATCCAGACCGTGTACAACACCAAGATGGCTAGCGTGG 

GACTTAGCGACATCGCCATGGATACCACCGTCACCCATGCCACCAGCCATGGCCGTGCCCA 

CAGTGTGGAGGAGTGCAGATGCCCCATTGGCTATTCTGGCTTGTCCTGCGAGAGCTGTGAT 

GCCCACrrCACTCGGGTGCCTGGTGGGCCCTACCTGGGCACCTGCTCTGGTTGCAGTTGCAA 

TGGCCATGCCAGCTCCTGTGACCCTGTGTATGGCCACTGCCTGAATTGCCAGCACAACACG 

GAGGGGCCACAGTGCAACAAGTGCAAGGCTGGCTTCTTTGGGGACGCCATGAAGGCCACG 

GCCACTTCCTGCCGGCCCTGCCCTTGCCCATACATCGATGCCTCCCGCAGATTCTCAGACAC 

TTGCTTCCTGGACACGGATGGCCAAGCCACATGTGACGCCTGTGCCCCAGGCTACACTGGC 

CGCCGCTGTGAGAGCTGTGCCCCCGGATACGAGGGCAACCCCATCCAGCCCGGCGGGAAGT 

GCAGGCCCGTCAACCAGGAGATTGTGCGCTGTGACGAGCGTGGCAGCATGGGGACCTCCGG 

GGAGGCCTGCCGCTGTAAGAACAATGTGGTGGGGCGCTTGTGCAATGAATGTGCTGACGGC 

TCTTTCCACCTGAGTACCCGAAACCCCGATGGCTGCCTCAAGTGCTTCTGCATGGGTGTCAG 

TCGCCACTGCACCAGCTCTTCATGGAGCCGTGCCCAGTTGCATGGGGCCTCTGAGGAGCCT 

GGTCACTTCAGCCTGACCAACGCCGCAAGCACCCACACCACCAACGAGGGCATCTTCTCCC 

CCACGCCCGGGGAACTGGGATTCTCCTCCTTCCACAGACTCTTATCTGGACCCTACTTCTGG 

AGCCTCCCTTCACGCTTCCTGGGGGACAAGGTGACCTCCTATGGAGGAGAGCTGCGCTTCA 

CAGTGACCCAGAGGTCCCAGCCGGGCTCCACACCCCTGCACGGGCAGCCGTTGGTGGTGCT 

GCAAGGTAACAACATCATCCTAGAGCACCATGTGGCCCAGGAGCCCAGCCCCGGCCAGCCC 

AGCACCTTCATTGTGCCTTTCCGGGAGCAAGCATGGCAGCGGCCCGATGGGCAGCCAGCCA 

CACGGGAGCACCTGCTGATGGCACTGGCAGGCATCGACACCCTCCTGATCCGAGCATCCTA 

CGCCCAGCAGCCCGCTGAGAGCAGGGTCTCTGGCATCAGCATGGACGTGGCTGTGCCCGAG 
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GAAACCGGCCAGGACCCCGCGCTGGAAGTGGAACAGTGCTCCTGCCCACCCGGGTACCGTG 

GGCCGTCCTGCCAGGACTGTGACACAGGCTACACACGCACGCCCAGTGGCCTCTACCTGGG 

TACCTGTGAACGCTGCAGCTGCCATGGCCACTCAGAGGCCTGCGAGCCAGAAACAGGTGCC 

TGCCAGGGCTGCCAGCATCACACGGAGGGCCCTCGGTGTGAGCAGTGCCAGCCAGGATACT 

ACGGGGACGCCCAGCGGGGGACACCACAGGACTGCCAGCTGTGCCCCTGCTACGGAGACC 

CTGCTGCCGGCCAGGCTGCCCACACTTGTTTTCTGGACACAGACGGCCACCCCACCTGTGAT 

GCGTGCTCCCCAGGCCACAGTGGGCGTCACTGTGAGAGGTGCGCCCCTGGCTACTATGGCA 

ACCCCAGCCAGGGCCAGCCATGCCAGAGAGACAGCCAGGTGCCAGGGCCCATAGGCTGCA 

ACTGTGACCCCCAAGGCAGCGTCAGCAGCCAGTGTGATGCTGCTGGTCAGTGCCAGTGCAA 

GGCCCAGGTAGAAGGCCTCACTTGCAGCCACTGCCGGCCCCACCACTTCCACCTGAGTGCC 

AGCAACCCAGACGGCTGCCTGCCCTGCTTCTGTATGGGCATCACCCAGCAGTGCGCCAGCT 

CTGCCTACACACGCCACCTGATCTCCACCCACTTTGCCCCTGGGGACTTCCAAGGCTTTGCC 

CTGGTGAACCCACAGCGAAACAGCCGCCTGACAGGAGAATTCACTGTGGAACCCGTGCCCG 

AGGGTGCCCAGCTCTCTTTTGGCAACTTTGCCCAACTCGGCCATGAGTCCTTCTACTGGCAG 

CTGCCGGAGACATACCAGGGAGACAAGGTGGCGGCCTACGGTGGGAAGTTGCGATACACC 

CTCTCCTACACAGCAGGCCCACAGGGCAGCCCACTCTCGGACCCCGATGTGCAGATCACGG 

GCAACAACATCATGCTAGTGGCCTCCCAGCCAGCGCTGCAGGGCCCAGAGAGGAGGAGCT 

ACGAGATCATGTTCCGAGAGGAATTCTGGCGCCGGCCCGATGGGCAGCCGGCCACACGCGA 

GCACCTCCTGATGGCACTGGCCGACCTGGATGAGCTCCTGATCCGGGCCACGTTCTCCTCCG 

TGCCGCTGGTGGCCAGCATCAGCGCAGTCAGCCTGGAGGTCGCCCAGCCGGGGCCCTCAAA 

CAGACCCCGCGCCCTCGAGGTGGAGGAGTGCCGCTGCCCGCCAGGCTACATCGGTCTGTCC 

TGCCAGGACTGTGCCCCCGGCTACACGCGCACCGGGAGTGGGCTCTACCTCGGCCACTGCG 

AGCTATGTGAATGCAATGGCCACTCAGACCTGTGCCACCCAGAGACTGGGGCCTGCTCGCA 

ATGCCAGCACAACGCCGCAGGGGAGTTCTGCGAGCTTTGTGCCCCTGGCTACTACGGAGAT 

GCCACAGCCGGGACGCCTGAGGACTGCCAGCCCTGTGCCTGCCCACTGACCAACCCAGAGA 

ACATGTTTTCCCGCACCTGTGAGAGCCTGGGAGCCGGCGGGTACCGCTGCACGGCCTGCGA 

ACCCGGCTACACTGGCCAGTACTGTGAGCAGTGTGGCCCAGGTTACGTGGGTAACCCCAGT 

GTGCAAGGGGGCCAGTGCCTGCCAGAGACAAACCAAGCCCCACTGGTGGTCGAGGTCCATC 

CTGCTCGAAGCATAGTGCCCCAAGGTGGCTCCCACTCCCTGCGGTGTCAGGTCAGTGGGAG 

CCCACCCCACTACTTCTATTGGTCCCGTGAGGATGGGCGGCCTGTGCCCAGCGGCACCCAG 

CAGCGACATCAAGGCTCCGAGCTCCACTTCCCCAGCGTCCAGCCCTCGGATGCTGGGGTCT 

ACATTTGCACCTGCCGTAATCTCCACCAATCCAATACCAGCCGGGCAGAGCTGCTGGTCAC 

TGAGGCTCCAAGCAAGCCCATCACAGTGACTGTGGAGGAGCAGCGGAGCCAGAGCGTGCG 

CCCCGGAGCTGACGTCACCTTCATCTGCACAGCCAAAAGCAAGTCCCCAGCCTATACCCTG 

GTGTGGACCCGCCTGCACAACGGGAAACTGCCCACCCGAGCCATGGATTTCAATGGCATCC 

TGACCATTCGCAACGTCCAGCTGAGTGATGCAGGCACCTACGTGTGCACCGGCTCCAACAT 

GTTTGCCATGGACCAGGGCACAGCCACTCTACATGTGCAGGCCTCGGGCACCTTGTCCGCC 

CCCGTGGTCTCCATCCATCCGCCACAGCTCACAGTGCAGCCCGGGCAACTGGCGGAGTTCC 

GCTGCAGCGCCACAGGGAGCCCCACGCCCACCCTCGAGTGGACAGGGGGCCCCGGCGGCC 

AGCTCCCTGCGAAGGCACAAATCCACGGCGGCATCCTGCGCCTGCCAGCTGTCGAGCCCAC 

GGATCAGGCCCAGTACTTGTGCCGAGCCCACAGCAGCGCTGGGCAGCAGGTGGCCAGGGCT 

GTGCTCCACGTGCATGGGGGCGGTGGGCCCAGAGTCCAAGTGAGCCCAGAGAGGACCCAG 

GTCCACGCAGGCCGGACCGTCAGGCTGTACTGCAGGGCTGCAGGCGTGCCTAGCGCCACCA 

TCACCTGGAGGAAGGAAGGGGGCAGCCTCCCACCACAGGCCCGGTCAGAGCGCACAGACA 

TCGCGACACTGCTCATCCCAGCCATCACGACTGCTGACGCCGGCTTCTACCTCTGCGTGGCC 

ACCAGCCCTGCAGGCACTGCCCAGGCCCGGATGCAAGTGGTTGTCCTTTCAGCCTCAGATG 

CCAGCCCACCGGGGGTCAAGATTGAGTCCTCATCGCCTTCTGTGACAGAAGGGCAAACACT 

CGACCTCAACTGTGTGGTGGCAGGGTCAGCCCATGCCCAGGTCACCTGGTACAGGCGAGGG 

GGTAGCCTGCCTCCCCACACCCAGGTGCACGGCTCCCGTCTGCGGCTCCCCCAGGTCTCACC 

AGCTGATTCTGGAGAATATGTGTGCCGTGTGGAGAATGGATCGGGCCCCAAGGAGGCCTCC 

ATTACTGTGTCTGTGCTCCACGGCACCCATTCTGGCCCCAGCTACACCCCAGTGCCCGGCAG 

CACCCGGCCCATCCGCATCGAGCCCTCCTCCTCACACGTGGCGGAAGGGCAGACCCTGGAT 

CTGAACTGCGTGGTGCCCGGGCAGGCCCACGCCCAGGTCACGTGGCACAAGCGTGGGGGC 

AGCCTCCCTGCCCGGCACCAGACCCACGGCTCGCTGCTGCGGCTGCACCAGGTGACCCCGG 



CCGACTCAGGCGAGTATGTGTGCCATGTGGTGGGCACCTCCGGCCCCCTAGAGGCCTCAGT 

CCTGGTCACCATCGAAGCCTCTGTCATCCCTGGACCCATCCCACCTGTCAGGATCGAGTCTT 

CATCCTCCACAGTGGCCGAGGGCCAGACCCTGGATCTGAGCTGCGTGGTGGCAGGGCAGGC 

CCACGCCCAGGTCACATGGTACAAGCGTGGGGGCAGCCTCCCTGCCCGGCACCAGGTTCGT 

GGCTCCCGCCTGTACATCTTCCAGGCCTCACCTGCCGATGCGGGACAGTACGTCTGCCGGG 

CCAGCAACGGCATGGAGGCCTCCATCACGGTCACAGTAACTGGGACCCAGGGGGCCAACTT 

AGCCTACCCTGCCGGCAGCACCCAGCCCATCCGCATCGAGCCCTCCTCCTCGCAAGTGGCG 

GAAGGGCAGACCCTGGATCTGAACTGCGTGGTGCCCGGGCAGTCCCATGCCCAGGTCACGT 

GGCACAAGCGTGGGGGCAGCCTCCCTGTCCGGCACCAGACCCACGGCTCCCTGCTGAGACT 

CTACCAAGCGTCCCCCGCCGACTCGGGCGAGTACGTGTGCCGAGTGTTGGGCAGCTCCGTG 

CCTCTAGAGGCCTCTGTCCTGGTCACCATTGAGCCTGCGGGCTCAGTGCCTGCACTTGGGGT 

CACCCCCACGGTCCGGATCGAGTCATCGTCTTCGCAAGTGGCCGAGGGGCAGACCCTGGAC 

CTGAACTGCCTCGTTGCTGGTCAGGCCCATGCCCAGGTCACGTGGCACAAGCGCGGGGGCA 

GCCTCCCGGCCCGGCACCAGGTGCATGGCTCGAGGCTACGCCTGCTCCAGGTGACCCCAGC 

TGATTCAGGGGAGTACGTGTGCCGTGTGGTCGGCAGCTCAGGTACCCAGGAAGCCTCAGTC 

CTTGTCACCATCCAGCAGCGCCTTAGTGGCTCCCACTCCCAGGGTGTGGCGTACCCCGTCCG 

CATCGAGTCCTCCTCAGCCTCCCTGGCCAATGGACACACCCTGGACCTCAACTGCCTGGTTG 

CCAGCCAGGCTCCCCACACCATCACCTGGTATAAGCGTGGAGGCAGCrrACCCAGCCGGCA 

CCAGATCGTGGGCTCCCGGCTGCGGATCCCTCAGGTGACTCCGGCAGACTCGGGCGAG'IAC 

GTGTGTCACGTCAGTAACGGTGCAGGCTCCCGGGAGACCTCGCTCATCGTCACCATCCAGG 

GCAGCGGTTCCTCCCACGTGCCCAGCGTCTCCCCACCGATCAGGATCGAGTCGTCTTCCCCC 

ACGGTGGTGGAAGGGCAGACCTTGGATCTGAACTGCGTGGTCGCCAGGCAGCCCCAGGCTA 

TCATCACATGGTACAAGCGTGGGGGCAGCCTTCCCTCCCGACACCAGACCCATGGCTCCCA 

CCTGCGGTTGCACCAAATGTCTGTGGCTGACTCGGGCGAGTATGTGTGCCGGGCCAACAAC 

AACATCGATGCCCTGGAGGCCTCCATCGTCATCTCCGTCTCCCCTAGCGCCGGCAGCCCCTC 

CGCCCCTGGCAGCTCCATGCCCATCAGAATTGAGTCATCCTCCTCACACGTGGCCGAAGGG 

GAGACCCTGGATCTGAACTGCGTGGTCCCCGGGCAGGCCCATGCCCAGGTCACTTGGCACA 

AGCGTGGGGGCAGCCTCCCCAGTCACCATCAGACCC 

GCGGCTCACGGCTGCGGCTGCACCATGTGTCCCCGGCCGACTCGGGTGAATACGTGTGCCG 

GGTGATGGGCAGCTCTGGCCCCCTGGAGGCCTCAGTCCTGGTCACCATCGAAGCCTCTGGC 

TCAAGTGCTGTCCACGTCCCCGCCCCAGGTGGAGCCCCACCCATCCGCATCGAGCCCTCCTC 

CTCCCGAGTGGCAGAAGGGCAGACCCTGGATCTGAAGTGCGTGGTGCCCGGGCAGGCCCAC 

GCCCAGGTCACATGGCACAAGCGTGGAGGAAACCTCCCTGCCCGGCACCAGGTCCACGGCC 

CACTGCTGAGGCTGAACCAGGTGTCCCCGGCTGACTCTGGCGAGTACTCGTGCCAAGTGAC 

CGGAAGCTCAGGCACCCTGGAGGCATCTGTCCTGGTCACAATTGAGCCCTCCAGCCCAGGA 

CCCATTCCTGCTCCAGGACTGGCCCAGCCCATCTACATCGAGGCCTCCTCTTCACACGTGAC 

TGAAGGGCAGACTCTGGATCTGAACTGTGTGGTGCCCGGGCAGGCCCATGCCCAGGTCACG 

TGGTACAAGCGCGGGGGCAGCCTCCCCGCCCGGCACCAGACCCATGGCTCCCAGCTGCGGC 

TCCACCTCGTCTCCCCTGCCGACTCAGGCGAGTATGTGTGTCGTGCAGCCAGCGGCCCAGG 

CCCTGAGCAAGAAGCCTCCTTCACAGTCACCGTCCCGCCCAGTGAGGGGTCTTCCTACCGC 

CTTAGGAGCCCGGTCATCTCCATCGACCCGCCCAGCAGCACCGTGCAGCAGGGCCAGGATG 

CCAGCTTCAAGTGCCTCATCCATGACGGGGCAGCCCCCATCAGCCTCGAGTGGAAGACCCG 

GAACCAGGAGCTGGAGGACAACGTCCACATCAGTCCCAATGGCTCCATCATCACCATCGTG 

GGCACCCGGCCCAGCAACCACGGTACCTACCGCTGCGTGGCCTCCAATGCCTACGGTGTGG 

CCCAGAGTGTGGTGAACCTCAGTGTGCACGGGCCCCCTACAGTGTCCGTGCTCCCCGAGGG 

CCCCGTGTGGGTGAAAGTGGGAAAGGCTGTCACCCTGGAGTGTGTCAGTGCCGGGGAGCCC 

CGCTCCTCTGCTCGTTGGACCCGGATCAGCAGCACCCCTGCCAAGTTGGAGCAGCGGACAT 

ATGGGCTCATGGACAGCCACGCGGTGCTGCAGATTTCATCAGCTAAACCATCAGATGCGGG 

CACTTATGTGTGCCTTGCTCAGAATGCACTAGGCACAGCACAGAAGCAGGTGGAGGTGATC 

GTGGACACGGGCGCCATGGCCCCAGGGGCCCCTCAGGTCCAAGCTGAAGAAGCTGAGCTG 

ACTGTGGAGGCTGGACACACGGCCACCrrGCGCTGCTCAGCCACAGGCAGCCCCGCGCCCA 

CCATCCACTGGTCCAAGCTGCGTTCCCCACTGCCCTGGCAGCACCGGCTGGAAGGTGACAC 

ACTCATCATACCCCGGGTAGCCCAGCAGGACTCGGGCCAGTACATCTGCAATGCCACTAGC 

CCTGCTGGGCACGCTGAGGCCACCATCATCCTGCACGTGGAGAGCCCACCATATGCCACCA 
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CGGTCCCAGAGCACGCTTCGGTGCAGGCAGGGGAGACGGTGCAGCTCCAGTGCCTGGCTCA 

CGGGACACCCCCACTCACCTTCCAGTGGAGCCGCGTGGGCAGCAGCCTTCCTGGGAGGGCG 

ACCGCCAGGAACGAGCTGCTGCACTTTGAGCGTGCAGCCCCTGAGGACTCAGGCCGCTACC 

GCTGCCGGGTCACCAACAAGGTGGGCTCAGCCGAGGCCTTTGCCCAGCTGCTCGTCCAAGG 

CCCTCCCGGCTCTCTCCCTGCCACCTCCATCCCAGCAGGGTCCACGCCCACCGTGCAGGTCA 

CGCCTCAGCTAGAGACCAAGAGCATTGGGGCCAGCGTTGAGTTCCACTGTGCTGTGCCCAG 

CGACCAGGGTACCCAGCTCCGTTGGTTCAAGGAAGGGGGTCAGCTGCCTCCGGGTCACAGC 

GTGCAGGATGGGGTGCTCCGAATCCAGAACTTGGACCAGAGCTGCCAAGGGACGTATATAT 

GCCAGGCCCATGGACCTTGGGGGAAGGCCCAGGCCAGTGCCCAGCTGGTTATCCAAGCCCT 

GCCCTCGGTGCTCATCAACATCCGGACCTCTGTGCAGACCGTGGTGGTTGGCCACGCCGTG 

GAGTTCGAATGCCTGGCACTGGGTGACCCCAAGCCTCAGGTGACATGGAGCAAAGTTGGAG 

GGCACCTGCGGCCAGGCATTGTGCAGAGCGGAGGTGTCGTCAGGATCGCCCACGTAGAGCT 

GGCTGATGCGGGACAGTATCGCTGCACTGCCACCAACGCAGCTGGCACCACACAATCCCAC 

GTCCTGCTGCTTGTGCAAGCCTTGCCCCAGATCTCAATGCCCCAAGAAGTCCGTGTGCCTGC 

TGGTTCTGCAGCTGTCTTCCCCTGCATAGCCTCAGGCTACCCCACTCCTGACATCAGCTGGA 

GCAAGCTGGATGGCAGCCTGCCACCTGACAGCCGCCTGGAGAACAACATGCTGATGCTGCC 

CTCAGTCCGACCCCAGGACGCAGGTACCTACGTCTGCACCGCCACTAACCGCCAGGGCAAG 

GTCAAAGCCTTTGCCCACCTGCAGGTGCCAGAGCGGGTGGTGCCCTACTTCACGCAGACCC 

CCTACTCCTTCCTACCGCTGCCCACCATCAAGGATGCCTACAGGAAGTTCGAGATCAAGAT 

CACCTTCCGGCCCGACTCAGCCGATGGGATGCTGCTGTACAATGGGCAGAAGCGAGTCCCA 

GGGAGCCCCACCAACCTGGCCAACCGGCAGCCCGACTTCATCTCCTTCGGCCTCGTGGGGG 

GAAGGCCCGAGTTCCGGTTCGATGCAGGCTCAGGCATGGCCACCATCCGCCATCCCACACC 

ACTGGCCCTGGGCCATTTCCACACCGTGACCCTGCTGCGCAGCCTCACCCAGGGCTCCCTG 

ATTGTGGGTGACCTGGCCCCGGTCAATGGGACCTCCCAGGGCAAGTTCCAGGGCCTGGATC 

TGAACGAGGAACTCTACCTGGGTGGCTATCCTGACTATGGTGCCATCCCCAAGGCGGGGCT 

GAGCAGCGGCTTCATAGGCTGTGTCCGGGAGCTGCGCATCCAGGGCGAGGAGATCGTCTTC 

CATGACCTCAACCTCACGGCGCACGGCATCTCCCACTGCCCCACCTGTCGGGACCGGCCCT 

GCCAGAATGGCGGTCAGTGCCATGACTCTGAGAGCAGCAGCTACGTGTGCGTCTGCCCAGC 

TGGCTTCACCGGGAGCCGCTGTGAGCACTCGCAGGCCCTGCACTGCCATCCAGAGGCCTGT 

GGGCCCGACGCCACCTGTGTGAACCGGCCTGACGGTCGAGGCTACACCTGCCGCTGCCACC 

TGGGCCGCTCGGGGTTGCGGTGTGAGGAAGGTGTGACAGTGACCACCCCCTCGCTGTCGGG 

TGCTGGCTCCTACCTGGCACTGCCCGCCCTCACCAACACACACCACGAGCTACGCCTGGAC 

GTGGAGTTCAAGCCACTCGCCCCTGACGGGGTCCTGCTGTTCAGCGGGGGGAAGAGCGGGC 

CTGTGGAGGACTTCGTGTCCCTGGCGATGGTGGGCGGCCACCTGGAGTTCCGCTATGAGTT 

GGGGTCAGGGCTGGCCGTTCTGCGGAGCGCCGAGCCGCTGGCCCTGGGCCGCTGGCACCGT 

GTGTCTGCAGAGCGTCTCAACAAGGACGGCAGCCTGCGGGTGAATGGTGGACGCCCTGTGC 

TGCGCTCCTCGCCCGGCAAGAGCCAGGGCCTCAACCTGCACACCCTGCTCTACCTGGGGGG 

TGTGGAGCCTTCCGTGCCACTGTCCCCGGCCACCAACATGAGCGCTCACTTCCGCGGCTGTG 

TGGGCGAGGTGTCAGTGAATGGCAAACGGCTGGACCTCACCTACAGTTTCCTAGGCAGCCA 

GGGCATCGGGCAATGCTATGATAGCTCCCCATGTGAGCGCCAGCCTTGCCAACATGGTGCC 

ACGTGCATGCCCGCTGGCGAGTATGAGTTCCAGTGCCTGTGTCGAGATGGATTCAAAGGAG 

ACCTGTGTGAGCACGAGGAGAACCCCTGCCAGCTCCGTGAACCCTGTCTGCATGGGGGCAC 

CTGCCAGGGCACCCGCTGCCTCTGCCTCCCTGGCTTCTCTGGCCCACGCTGCCAACAAGGCT 

CTGGACATGGCATAGCAGAGTCCGACTGGCATCTTGAAGGCAGCGGGGGCAATGATGCCCC 

TGGGCAGTACGGAGCCTATTTCCACGATGATGGCrrCCTCGCCTTCCCTGGCCATGTCTTCT 

CCAGGAGCCTGCCCGAGGTGCCCGAGACCATCGAGCTGGAGGTTCGGACCAGCACAGCCA 

GTGGCCTCCTGCTCTGGCAGGGTGTGGAGGTGGGAGAGGCCGGCCAAGGCAAGGACTTCAT 

CAGCCTCGGGCTTCAAGACGGGCACCTTGTCTTCAGGTACCAGCTGGGTAGTGGGGAGGCC 

CGCCTGGTCTCTGAGGACCCCATCAATGACGGCGAGTGGCACCGGGTGACAGCACTGCGGG 

AGGGCCGCAGAGGTTCCATCCAAGTCGACGGTGAGGAGCTGGTCAGCGGCCGGTCCCCAG 

GTCCCAACGTGGCAGTCAACGCCAAGGGCAGCGTCTACATCGGCGGAGCCCCTGACGTGGC 

CACGCTGACCGGGGGCAGATTCTCCTCGGGCATCACAGGCTGTGTCAAGAACCTGGTGCTG 

CACTCGGCCCGACCCGGCGCCCCGCCCCCACAGCCCCTGGACCTGCAGCACCGCGCCCAGG 

CCGGGGCCAACACACGCCCCTGCCCCTCGTAGGCACCTGCCTGCCCCACACGGACTCCCGG 
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GCCACGCCCCAGCCCGACAATGTCGAGTATATTATTATTAATATTA7TATGAATTTTTGTAA 
GAAACCGAGGCGATGCCACGCTTTGCTGCTACCGCCCTGGGCTGGACTGGAGGTGGGCATG 
CCACCCTCACACACACAGCTGGGCAAAGCCACAAGGCTGGCCAGCAAGGCAGGTTGGATG 
GGAGTGGGCACCTCAGAAAGTCACCAGGACTTGGGGTCAGGAACAGTGGCTGGGTGGGCC 
5 CAGAACTGCCCCCACTGTCCCCCTACCCACCGATGGAGCCCCCAGATAGAGCTGGGTGGCC 
TGTTTCTGCAGCCCTTGGGCAGTTCTCACTCCTAGGAGAGCCAACCTCGGCTTGTGGGCTGG 
TGCCCCACAGCTACCTGAGACGGGCATCGCAGGAGTCTCTGCCACCCACTCAGGATTGGGA 
ATTGTCTTTAGTGCCGGCTGTGGAGCAAAAGGCAGCTCACCCCTGGGCAGGCGGTCCCCAT 
CCCCACCAGCTCGTTTTTCAGCACCCCCACCCACCTCCACCCAGCCCCTGGCACCTCCTCTG 

10 GCAGACTCCCCCTCCTACCACGTCCTCCTGGCCTGCATTCCCACCCCCTCCTGCCAGCACAC 
AGCCTGGGGTCCCTCCCTCAGGGGCTGTAAGGGAAGGCCCACCCCAACTCTTACCAGGAGC 
TGCTACAGGCAGAGCCCAGCACTGATAGGGCCCCGCCCACCGGGCCCCGCCCACCCCAGGC 
CACATCCCCACCCATCTGGAAGTGAAGGCCCAGGGACTCCTCCAACAGACAACGGACGGAC 
GGATGCCGCTGGTGCTCAGGAAGAGCTAGTGCCTTAGGTGGGGGAAGGCAGGACTCACGA 

15 CTGAGAGAGAGAGGAGGGGGATATGACCACCCTGCCCCATCTGCAGGAGCCTGAAGATCC 
AGCTCAAGTGCCATCCTGCCAGTGGCCCCCAGACTGTGGGGTTGGGACGCCTGGCCTCTGT 
GTCCTAGAAGGGACCCTCCTGTGGTCrTTGTCTTGATTTTTCTTAATAAACGGTGCTATCCC 
CGCC 

20 GM2 activntcur 

SEQ ID 58 IPTGEPCPEP LRTYG 
SEQ ID 59 lES VLSSSGK RLG 
SEQ ID 60 ATPAQAHLKK PSQLSSFS 

25 Saposinc B 

SEQ ID 61 RIQAMIPKGA LRVAV 
SEQ ID 62 GICQCLAERY SVILL 

Calgranulinc B 
30 SEQ ID 63 EKMHEGDEGP GHHHKPG 
SEQ ID 64 DLQNFLKKEN KNE 
SEQ ID 65 VKLGHPDTLN QGEFKELVR 

35 Peptide mute 1 

SEQ ID N° 68 FSWDNCFEGK DPAVIR 

SEQ ID N%6 TTYWSNTGGG AYAAYTGYTT YG ARGGNA AR GAYCCNGCNG TNATHMGN 

40 

Peptide mute 2 

SEQ ID N** 69 YSLPKSEFAV PDLELP 
45 SEQ ID N^? TAYWSNYTNC CNAARWSNGA RTTYGCNGTN CCNGAYYTNG ARYTNCCN 
SEQ ID N° 69 > NAME = 'Reverse-Translation of PERLECAN' : TYPE = DNA 

GAYGCNCCNGGNCARTAYGGNGCNTAYTTYCAYGAYGAYGGNTTYYTNGCNTTYCCNGGN 
CAYGThm^WSNMGNWSNYTNCCNGARGTNCCNGARACNATHGARYTNGARGTNMGNACN 
50 WSNACNGCNWSNGGNYTNYTNYTNTGGCARGGNGTNGARGTNGGNGARGCNGGNCARGGN 
AARGAYTTYATHWS^^r^NGG^^rmCARGAYGGNCAYYTNGT^mVMGOT 
WSNGGNGARGCNMGNYTNGTNWSNGARGAYCCNATHAAYGAYGGNGARTGGCAYMGNGT 
NACNGC^^^TNMGNGARGGNMGNMGNGGNWS^^^1GNCARGTNGAYGGNGARGARYTNGTN 
WSNGGNMGNWSNCCNGGNCCNAAYGTNGCNGTNAAYGCNAARGGNWSNGTNTAYATHGG 
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NGGNGCNCCNGAYGTNGCNACNYTNACNGGNGGNMGNTTYWSNWSNGGNATHACNGGNT 

GYGTNAARAAYYTNGTNYTNCAYWSNGCNMGNCCNGGNGCNCCNCCNCCNCARCCNYTNG 

AYYTNCARCAYMGNGCNCARGCNGGNGCNAAYACNMGNCCNTGYCCNWSN 



SEQ ID N° 70> NAME = 'Reverse-Translalion of RBP ' : TYPE = DNA 

ATGAARTGGGTNTGGGCWThrnTvrrrNYTNGCNGCNTGGGCNGCNGCNGARMGNGAYTGY 

MGNGTNWSNWSNTTYMGNGTNAARGARAAYTTYGAYAARGCNMGNTTYWSNGGNACNTG 

GTAYGCNATGGCNAARAARGAYCCNGARGGNYTNTTYYTNCARGAYAAYATHGTNGCNGA 

RTTYWSNGTNGAYGARACNGGNCARATGWSNGCNACNGCNAARGGNMGNGTNMGNYTW 

TNAAYAAYTGGGAYGTNTGYGCNGAYATGGTNGGNACNTTYACNGAYACNGARGAYCCNG 

CNAARTTYAARATGAARTAYTGGGGNGTNGCNWSNTTYYTNCARAARGGNAAYGAYGAYC 

AYTGGATHGTNGAYACNGAYTAYGAYACNTAYGCNGTNCARTAYWSNTGYMGNYTNYTNA 

AYYTNGAYGGNACNTGYGCNGAYWShn-AYWSNTTYGTNTTYWSNMGNGAYCCNAAYGGN 

YTNCCNCCNGARGCNCARAARATHGTNMGNCARMGNCARGARGARYTNTGYYTNGCNMGN 

CARTAYMGNYTNATHGTNCAYAAYGGOTAYTGYGAYGGNMGNWSNGARMGNAAYYTNYT 
N 



SEQ 71 > NAME = 'Reverse-Translation of GM2MUT F : TYPE = DNA 

ATGCARWSNYTNATGCARGCNCCNYTNYTNATHGCNYTNGGNYTNYTNYTNGCNACNCCN 

GCNCARGCNCAYYTNAARAARCCNWSNCARYTNWSNWSNTTYWSNTGGGAYAAYTGYTTY 

GARGGNAARGAYCCNGCNGTNATHMGNWSNYTNACNYTNGARCCNGAYCCNATHGTNGTN 

CCNGGNAAYGTNACNYTNWSNGTNGTNGGNWSNACNWSNGTNCCMYTNWSNWSNCCNYT 

NAARGTNGAYYTNGTNYTNGARAARGARGTNGCNGGKYTNTGGATHAARATHCCNTGYAC 

NGAYTAYATHGGNWSNTGYACNTTYGARCAYTTTYTGYGAYGTNYTNGAYATGYTNATHCC 

NACNGGNGARCCNTGYCCNGARCCNYTNMGNACNTAYGGNYTNCCNTGYCAYTGYCCNTT 

YAARGARGGNACNTAYWSNYTNCCNAARWSNGARTTYGCNGTNCCNGAYYTNGARYTNCC 

NWSNTGGYTNACNACNGGNAAYTAYMGNATHGARWSNGTNYTNWSNWSNWSNGGNAARM 

GNYTNGGNTGYATHAARATHGCNGCNWSNYTNAARGGNATH 
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REVENDICATIONS 



1. Utilisation d'au moins un polypeptide comprenant au moins un fragment 
d*une proteine pour obtenir une composition diagnostique, pronostique, prophylactique 

5 ou therapeutique destinee a detecter, prevenir ou traiter un etat pathologique associe a 
une maladie degenerative et/ou neurologique et/ou auto-immune, ladite proteine etani 
choisie parmi les proteines dont la sequence peptidique a Tetat natif correspond a SEQ 
ro N** 1, SEQ ID 2, SEQ ID N° 3, SEQ ID N° 4, SEQ ID N° 5, SEQ ID N° 6, SEQ 
ID N*' 7, SEQ ID N° 8, SEQ ID N° 10, SEQ ID N° 1 1, SEQ ID N° 12, SEQ ID N° 13, 

10 SEQ ID N° 14, SEQ ID N° 1 5, SEQ ID N° 16, SEQ ID N° 17, SEQ ID N° 18, SEQ ID 
N= 19, SEQ ID rr 20, SEQ ID N° 21, SEQ ID 22, SHO ID N° 23, SEQ ID N° 24, 
SEQ ID N° 25, SEQ ID N° 26, SEQ ID N° 27, SEQ ID N° 28 et SEQ ID N° 29, et les 
sequences peptidiques qui presentent au moins 70 % d'identite, de preference au moins 
80 % d'identite et avantageusement au moins 98 % d'identite avec Tune quelconque des 

15 sequences peptidiques SEQ ID N° 1 a SEQ ID N° 8 et SEQ ID N° 1 0 a SEQ ID N° 29, 
et les sequences peptidiques ou les fragments desdites sequences appartenant i une 
meme famille de proteines choisies parmi le perlecan, le precurseur de la proteine 
piasmatique de liaison au retinol, du precurseur de Cacti vat eur du ganglioside GM2, de 
la calgranuline B et de la sapostne B. 

20 

2. Utilisation d'au moins deux polypeptides en combinaison, lesdits 
polypeptides comprenant chacun au moins un fragment d'une proteine, pour obtenir une 
composition diagnostique, pronostique, prophylactique ou therapeutique destinee a 
detecter. prevenir ou traiter un etat pathologique associe a une maladie degenerative 

25 et/ou neurologique et/ou auto-immune, ladite proteine etant choisie parmi les proteines 
dont la sequence peptidique a Tetat natif correspond a une sequence peptidique choisie 
parmi SEQ ID N** 1 a SEQ ID N° 8 et SEQ ID N° 10, SEQ ID N° 29, et les sequences 
peptidiques qui presentent au moins 70 % d'identite, de preference au moins 80 % 
d'identite et avantageusement au moins 98 % d'identite avec Tune quelconque des 

30 sequences peptidiques SEQ ID 1 a SEQ ID N** 8 et SEQ ID N** 10 a SEQ ID N° 29. 
et les sequences peptidiques ou les fragments desdites sequences appartenant a une 
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meme famille de proteines choisies parmi le perlecan, le precurseur de la proteine 
plasmatique de liaison au retinol, du precurseur de I'activateur du ganglioside GM2, de 
la calgranuline B et de la saposine B. 



d'une proteine pour obtenir une composition diagnostique, pronostique, prophylactique 
ou therapeutique destinee a detecter, prevenir ou traiter un etat pathologique associe a 
une maladie degenerative et/ou neurologique et/ou auto-immune, ladite proteine etant 
choisie parmi les proteines dont la sequence peptidique a Tetat natif correspond a SEQ 
10 ID N** 2. SEQ ID N** 4, SEQ ID N° 8, SEQ ID NM7 et SEQ ID N° 24 et les sequences 
peptidiques qui presentent au moins 70 % d'identite, de preference au moins 80 % 
dMdentite et avantageusement au moins 98 % d'identite avec Tune quelconque des 
sequences peptidiques SEQ ID N° 2, SEQ ID 4, SEQ ID N° 8, SEQ ID N° 17 et 
SEQ ID N° 24. 



combinaison, lesdils polypeptides comprenant chacun au moins un fragment d'une 
proteine, pour obtenir une composition diagnostique, pronostique, prophylactique ou 
therapeutique destinee a detecter, pronostiquer, prevenir ou traiter un etat pathologique 

20 associe a une maladie degenerative et/ou neurologique et/ou auto-immune, ladite 
proteine etant choisie parmi les proteines dont la sequence peptidique a Tetat natif 
correspond a SEQ ID N° 2, SEQ ID N° 4, SEQ ID N° 8, SEQ ID 17 et SEQ ID N° 
24 et les sequences peptidiques qui presentent au moins 70 % d'identite, de preference 
au moins 80 % d'identite et avantageusement au moins 98 % d'identite avec Tune 

25 quelconque des sequences peptidiques SEQ ID N*> 2„ SEQ ID 4, SEQ ID N" 8, SEQ 
IDN° 17etSEQIDN*>24. 

5. Utilisation selon Tune quelconque des revendications 1 a 4. caracterisee 
en ce que la sequence peptidique dudit polypeptide comprend une sequence choisie 
30 parmi Tune quelconque des SEQ ID 2, SEQ ID N° 4, SEQ ID N° 8, SEQ ID N° 17 



5 



3. Utilisation d'au moins un polypeptide comprenant au moins un fragment 



15 



4. Utilisation selon la revendication 3, de cinq polypeptides en 



et SEQ ID N*^ 24. 
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6. Utilisation selon i'une quelconque des revendications I a 4, caracterisee 
en ce que la sequence peptidique dudit polypeptide consiste en une sequence choisie 
parmi I'une quelconque des SEQ ID N° 2. SEQ ID N° 4, SEQ ID N** 8, SEQ ID N° 17 

5 et SEQ ID N° 24. 

7. Utilisation d*un fragment polypeptidique defini dans la revendication 1 
ou dans !a revendication 3 pour la preparation d'un peptide immunogene, caracterise en 
ce que ledit peptide comprend tout ou partie d'au moins une des sequences referencee 

10 SEQ ID N° 58 a 65. 

8. Utilisation d'au moins un fragment nucleotidique, pour obtenir une 
composition diagnostique, pronostique, prophylactique ou therapeutique destinee a 
detecter, pronostiquer, prevenir ou traiter un etat pathologique associe a une maladie 

15 degenerative et/ou neurologique et/ou auto-immune, selon laquelle ledit fragment 
nucleotidique est choisi parmi des fragments qui codent pour au moins un fragment 
d*une proteine, ladite proteine etant choisie parmi les proteines dont la sequence 
peptidique a I'etat natif correspond a SEQ ID N"" 1, SEQ ID N** 2, SEQ ID N*" 3, SEQ 
ID N° 4. SEQ ID N° 5, SEQ ID N** 6. SEQ ID N° 7, SEQ ID N<» 8, SEQ ID N** 10. 

20 SEQ ID 11, SEQ ID 12, SEQ ID 13, SEQ ID N° 14, SEQ ID 15, SEQ ID 
N° 16, SEQ ID 17, SEQ ID N° 18, SEQ ID N° 1 9, SEQ ID N° 20, SEQ ID N° 21, 
SEQ ID N'' 22, SEQ ID N° 23. SEQ ID N° 24, SEQ ID N° 25, SEQ ID N° 26, SEQ ID 
N° 27, SEQ ID N° 28 et SEQ ID N° 29 et les sequences peptidiques qui presentent au 
moins 70 Vo d'identite, de preference au moins 80 % et avantageusement au moins 98 % 

25 d'identite avec Tune quelconque des sequences peptidiques SEQ ID N** 1 a SEQ ID N° 
8 et SEQ ID 10 a 29. les fragments complementaires desdits fragments et les 
fragments qui codent pour les sequences peptidiques ou les fragments desdites 
sequences appartenant a une meme famille de proteines choisie parmi le perlecan. le 
precurseur de la proteine plasmatique de liaison au retinol, du precurseur de I'activateur 

30 du ganglioside GM2, de la calgranuline B et de la saposine B. 
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9. Utilisation seion la revendication 8, caracterisee en ce que ledit fragment 
nucleotidique code pour ladite proteine. 



10. Utilisation seion la revendication 9, caracterisee en ce que la sequence 
5 peptidique de ladite proteine a I'etat natif consiste en une sequence choisie parmi Tune 

quelconque des SEQ ID N** 1 a 8 et SEQ ID N° 1 0 a 29 at les sequences peptidiques ou 
les fragments desdites sequences appartenant a une meme famille de proteines choisies 
parmi le perlecan, le precurseur de la proteine plasmatique de liaison au retinol, du 
precurseur de Tactivateur du ganglioside GM2, de la calgranuiine B et de la saposine B. 

10 

11. Utilisation d'au moins un fragment nucleotidique pour obtenir une 
composition diagnostique, pronostique, prophylactique ou therapeutique destinee a 
detecter, pronostiquer, prevenir ou traiter un etat pathologique associe a une maladie 
degenerative et/ou neurologique et/ou auto-immune seion laquelle ledit fragment est un 

15 fragment d'une sequence nucleique choisie parmi Tune quelconque des SEQ ID N** 30, 
SEQ ID N** 3 1, SEQ ID N** 32, SEQ ID 33, SEQ ID 34, SEQ ID N** 35. SEQ ID 
N*' 36, SEQ ID N*^ 37, SEQ ID N° 38, SEQ ID N** 39, SEQ ID N*» 40, SEQ ID N** 41, 
SEQ ID N° 42, SEQ ID N° 43, SEQ ID N<> 44, SEQ ID N« 45, SEQ ID N** 46 et SEQ 
ID 47, SEQ ID N*' 48, SEQ ID N° 49 et SEQ ID N° 50, SEQ ID N° 5 1, SEQ ID N° 

20 52, SEQ ID 53, SEQ ID N*' 54, SEQ ID N** 55, SEQ ID 56, SEQ ID N'' 57, 
SEQ ID N° 67, SEQ ID N° 68, SEQ ID N° 69, SEQ ID 70 et SEQ ID N° 71 et leurs 
sequences complementaires. 



12. Utilisation d*un ligand specifique d'un polypeptide ou d'un fragment 
25 nucleotidique seion Tune quelconque des revendications pr^cedentes pour obtenir une 
composition diagnostique, pronostique, prophylactique ou therapeutique destinee a 
detecter, pronostiquer, prevenir ou traiter un etat pathologique associe a une maladie 
degenerative et/ou neurologique et/ou auto-immune. 
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13. Utilisation selon Tune quelconque des revendications precedentes, 
caracterisee en ce que la maladie degenerative et/ou auto-immune est la sclerose en 
plaques. 

5 14. Precede pour detecter au moins une proteine associee a une maladie 

degenerative et/ou auto-immune, dans un echantillon biologique, caracterise en ce que 
Ton met en contact Techantillon biologique avec au moins un ligand specifique d'au 
moins un polypeptide, ledit polypeptide comprenant au moins un fragment d'une 
proteine et ladite proteine etant choisie parmi les proteines dont la sequence peptidique a 

10 Tetat natif correspond a SEQ ID N*' 1, SEQ ID N*» 2, SEQ ID N** 3, SEQ ID N** 4, SEQ 
ID N° 5, SEQ ID N° 6, SEQ ID N° 7, SEQ ID N° 8, SEQ ID N° 10, SEQ ID N° 1 L 
SEQ ID N° 12, SEQ ID N° 13, SEQ ID N° 14, SEQ ID N° 15, SEQ ID N° 16, SEQ ID 
N° 17, SEQ ID N° 18, SEQ ID N° 19, SEQ ID N° 20, SEQ ID N° 21, SEQ ID N° 22, 
SEQ ID N° 23, SEQ ID N° 24, SEQ ID N° 25, SEQ ID N° 26, SEQ ID N° 27, SEQ ID 

15 N° 28 et SEQ ID N** 29 et les sequences peptidiques qui presentent au moins 70 % 
d'identite de preference au moins 80 % d'identite et avantageusement au moins 98 
d'identite avec I'une quelconque des sequences peptidiques SEQ ID N** 1 a SEQ ID N** 
8 et SEQ ID N*" 10 a 29. et les sequences peptidiques ou les fragments desdites 
sequences appartenant a une meme famille de proteines choisies parmi le perlecan, le 

20 precurseur de la proteine plasmatique de liaison au retinol, du precurseur de Tactivateur 
du ganglioside GM2, de la calgranuline B el de la saposine B, puis on detecte la 
formation d'un complexe entre ledit polypeptide et ledit ligand. 

15. Procede selon la revendication 14, caracterise en ce que ledit ligand est 
25 un anticorps monoclonal, un anticorps polyclonal, un recepteur, un substrat d'activite 

enzymatique ou une enzyme dont ledit polypeptide est un cofacteur. 

16. Procede pour detecter au moins un ligand associe a une maladie 
degenerative et/ou auto-immune, dans un echantillon biologique, caracterise en ce que 

30 Ton met en contact rechantillon biologique avec au moins un polypeptide comprenant 
au moins un fragment d'une proteine, ladite proteine etant choisie parmi les proteines 
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dont la sequence peptidique a I'etat natif correspond a SEQ ID N° 1, SEQ ID N° 2, 
SEQ ID N** 3, SEQ ID N° 4, SEQ ID N** 5 SEQ ID N° 6, SEQ ID N° 7, SEQ ID N*' 8, 
SEQ ID N° 10, SEQ ID N° i 1, SEQ ID N** 12, SEQ ID N° 13, SEQ ID N° 14, SEQ ID 
N° 15, SEQ ID N° 16, SEQ ID N° 17, SEQ ID N** 18, SEQ ID N° 19, SEQ ID N« 20, 
5 SEQ ID N° 21, SEQ ID N° 22, SEQ ID N° 23, SEQ ID N** 24, SEQ ID N° 25, SEQ ID 
N° 26, SEQ ID N° 27, SEQ IDN° 28 et SEQ ID N° 29, les sequences peptidiques qui 
presentent au moins 70 % d'identite, de preference au moins 80 % d'identite et 
avantageusement au moins 98 % d'identite avec I'une quelconque des sequences 
peptidiques SEQ ID N° 1 a SEQ ID 8 et SEQ ID N° 10 a SEQ ID 29. et les 
10 sequences peptidiques ou les fragments desdites sequences appartenant a une meme 
famille de proteines choisie parmi le perlecan, le precurseur de la proteine plasmatique 
de liaison au retinol, du precurseur de Tactivateur du ganglioside GM2, de la 
calgranuiine B et de la saposine B, puis on detecte la formation d'un complexe entre 
ledit polypeptide et ledit ligand. 

15 

17. Procede selon la revendication 16, caracterise en ce que le ligand est un 
anticorps. un recepteur, un substrat d*activite enzymatique ou une enzyme dont ledit 
polypeptide est un cofacteur. 

20 18. Procede selon I'une quelconque des revendications 14 a 17, caracterise 

en ce que la sequence dudit polypeptide comprend une sequence peptidique choisie 
parmi Tune quelconque des SEQ ID N° 1 a 8 et SEQ ID N° 10 a 29. 

19. Procede selon Tune quelconque des revendications 14 a 17, caracterise 
25 en ce que la sequence dudit polypeptide consiste en une sequence peptidique choisie 

parmi Tune quelconque des SEQ ID NM a 8 et SEQ ID NMO a 29. 

20. Procede selon Tune quelconque des revendications 14 a 19, caracterise 
en ce que Techantillon bioiogique est I'urine, le liquide cephalo-rachidien ou le serum. 

30 



21. Procede selon Tune quelconque des revendications 14 a 20, caracterise 
en ce que la maladie degenerative et/ou auto-immune est la sclerose en plaques. 

22. Polypeptide caracterise en ce qu'il comprend au moins un fragment 
d'une proteine dont la sequence peptidique correspond a SEQ ID N° 9, ledit fragment 
comprenant au moins una mutation par rapport a la sequence de reference SEQ ID N*' 8. 

23. Polypeptide selon la revendication 22, caracterise en ce qu'il comprend 
au moins deux mutations par rapport a la sequence de reference SEQ ID 8. 

24. Polypeptide selon la revendication 22, caracterise en ce nu'il est choisi 
parmi les polypeptides qui comprennent la sequence en acides amines 
FSWDNCFEGKDPAVIR, referencee SEQ ID N'^ 68 et la sequence en acides amines 
YSLPKSEFAVPDLELP, referencee SEQ ID N'^ 69. 

25. Polypeptide selon Tune des revendications 22 a 24, caracterise en ce 
qu'il comprend une proteine dont la sequence peptidique correspond a SEQ ID 9. 

26. Polypeptide selon Tune des revendications 22 a 25, caracterise en ce 
qu'il consiste en une proteine dont la sequence peptidique correspond a SEQ ID N° 9. 

27. Utilisation d'au moins un polypeptide selon Tune quelconque des 
revendications 22 a 26 pour obtenir une composition diagnostique, pronostique, 
prophylactique ou therapeutique destinee a detecter, pronostiquer, prevenir ou trailer un 
etat pathologique associe a une maladie degenerative et/ou neurologique et/ou auto- 
immune. 

28. Utilisation selon la revendication 26, caracterisee en ce que le 
polypeptide tel que deflni dans Tune quelconque des revendications 22 a 26 est utilise en 
melange avec au moins un polypeptide tel que defini dans Tune quelconque des 
revendications 1 a 5. 
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29. Precede pour detecter au moins un ligand associe a une maladie 
degenerative et/ou auto-immune, dans un echantillon biologique, caracterise en ce que 
Ton met en contact I'echantillon biologique avec au moins un polypeptide tel que defini 

5 dans I'une quelconque des revendications 22 a 26, puis on detecte !a formation d'un 
complexe entre ledit polypeptide et le ligand. 

30. Procede selon la revendication 29, caracterise en ce que I'on met en 
contact rechantillon biologique avec un polypeptide tel que defini dans Tune quelconque 

10 des revendications 22 a 26 et avec au moins un polypeptide tel que defmi dans Tune 
quelconque des revendications 1 a 5. 

31. Procede selon la revendication 29 ou 30, caracterise en ce que ledit 
ligand est un anticorps, un recepteur, un substrat d'activite enzymatique ou une enzyme 

15 dont ledit polypeptide est un cofacteur. 

32. Procede pour detecter au moins un polypeptide tel que defini dans Tune 
quelconque des revendications 22 a 26 dans un echantillon biologique caracterise en ce 
que I'on met en contact Techantillon biologique avec au moins un ligand specifique 

20 dudit polypeptide, puis on detecte la formation d'un complexe entre ledit polypeptide et 
ledit ligand. 

33. Procede selon la revendication 32, caracterise en ce que ledit ligand est 
anticorps monoclonal, un anticorps polyclonal, un recepteur, un substrat d'activite 

25 enzymatique ou une enzyme dont ledit polypeptide est un cofacteur. 

34. Procede selon la revendication 30 ou 3 1, caracterise en ce que Ton met 
en contact Pechantillon biologique avec un ligand tel que defmi dans Tune quelconque 
des revendications 31 et 33 et au moins un ligand specifique d'au moins un polypeptide 

30 tel que defmi dans Tune quelconque des revendications I a 5, puis on detecte la 
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formation de complexes entre iesdits polypeptides et lesdits ligands specifiques desdits 
polypeptides. 

35. Procede selon la revendication 34, caracterise en ce que le ligand est un 
anticorps monoclonal, un anticorps polyclonal, un recepteur, un substrat d'activite 
enzymatique ou une enzyme dent ledit polypeptide est un cofacteur. 

36. Fragment nucleotidique caracterise en ce qu'il code pour un 
polypeptide tel que defini dans Tune quelconque des revendications 22 a 26. 

37. Utilisation d'un fragment nucleotidique pour obtenir une composition 
diagnostique, pronostique, prophylactique ou therapeutique destinee a detecter, 
pronostiquer, prevenir ou traiter un etat pathotogique associe a une maladie 
degenerative et/ou auto-immune, selon laquelle ledit fragment nucleotidique est le 
fragment nucleotidique defini dans la revendication 35, eventueilement en association 
avec au moins un fragment nucleotidique tel que defini dans Tune quelconque des 
revendications 8 a 1 1, et les fragments complementaires desdits fragments. 

38. Procede selon Tune quelconque des revendications 29 a 35, caracterise 
en ce que Techantillon biologique est Purine, le liquide cephalo-rachidien ou le serum. 

39. Procede selon Tune quelconque des revendications 29 a 36 caracterise 
en ce que la maladie degenerative et/ou auto-immune est la sclerose en plaques. 

40. Procede pour detecter au moins un polypeptide tel que defini dans Tune 
quelconque des revendications 1 a 5 ou dans i'une quelconque des revendications 22 a 
26, selon lequel on preleve un echantillon d'un fluide biologique d'un patient presentant 
un etat pathologique associe a une maladie degenerative et/ou neurologique et/ou auto- 
immune et eventueilement apres purification dudit echantillon de fluide biologique, on 
analyse par spectrometrie de masse ie profit de masse obtenu a partir du fluide 
biologique et on compare a un profil de masse de reference. 
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41. Utilisation d'au moins un polypeptide comprenant au moins un 
fragment d'une proteine pour tester refficacite d*un agent therapeutique, ladite proteine 
etant choisie parmi les proteines dont la sequence peptidique a l*etat natif correspond a 
5 SEQ ID N° 1, SEQ ID N° 2, SEQ ID N° 3, SEQ ID N° 4, SEQ ID N° 5. SEQ ID N° 6, 
SEQ ID N° 7. SEQ ID N° 8, SEQ ID N° 9, SEQ ID N° 10, SEQ ID 11, SEQ ID N° 
12, SEQ ID N° 13, SEQ ID N° 14, SEQ ID N** 15, SEQ ID N° 16, SEQ ID N° 17, 
SEQ ID N° 18, SEQ ID N° 19, SEQ ID 20, SEQ ID N« 21, SEQ ID N° 22. SEQ ID 
23, SEQ ID N** 24, SEQ ID N** 25, SEQ ID 26, SEQ ID N° 27, SEQ ID 28 et 

10 SEQ ID N° 29, les sequences peptidiques qui presentent au moins 70 % d*identite de 
preference au moins 80 % d'identite et avantageusement au moins 98 d'identite avec 
I'une quelconque des sequences peptidiques SEQ ID N° 1 a 29, et les sequences 
peptidiques ou les fragments desdites sequences appartenant a une meme famiile de 
proteines choisie parmi le perlecan, le precurseur de la proteine plasmatique de liaison au 

15 retinol, du precurseur de Tactivateur du ganglioside GM2, de la calgranuline B et de la 
saposine B. 



42. Utilisation d'au moins un polypeptide comprenant au moins un 
fragment d'une proteine pour deflnir un materiel biologique pour la preparation d'une 

20 composition pharmaceutique destinee au traitement d'une maladie degenerative et/ou 
neurologique et/ou auto-immune, telle que la sclerose en plaques, ladite proteine etant 
choisie parmi les proteines dont la sequence peptidique a I'etat natif correspond a SEQ 
ID N° 1, SEQ ID M° 2, SEQ ID N° 3, SEQ ID N° 4, SEQ ID 5, SEQ ID N'=' 6, SEQ 
ID N° 7, SEQ ID N° 8, SEQ ID N° 9, SEQ ID N° 10, SEQ ID N° 11, SEQ ID N° 12, 

25 SEQ ID N** 13, SEQ ID N° 14, SEQ ID N*» 1 5, SEQ ID N° 16, SEQ ID 17, SEQ ID 
N° 18, SEQ ID N*» 19, SEQ ID N° 20, SEQ ID N** 21, SEQ ID N° 22. SEQ ID N*' 23, 
SEQ ID N° 24, SEQ ID N** 25. SEQ ID N** 26, SEQ ID N** 27. SEQ ID 28 et SEQ 
ID 29, les sequences peptidiques qui presentent au moins 70 % d'identite de 
preference au moins 80 % d'identite et avantageusement au moins 98 d'identite avec 

30 i'une quelconque des sequences peptidiques SEQ ID N° 1 a 29, et les sequences 
peptidiques ou les fragments desdites sequences appartenant a une meme famiile de 




proteines choisie parmi le perlacan, le precurseur de ia proteine plasmatique de liaison au 
retinol, du precurseur de Tactivateur du ganglioside GM2, de la calgranuline et de la 
saposine. 

5 43. Utilisation selon la revendication 41 ou 42, caracterisee en ce que le 

polypeptide est choisi parmi SEQ ID N° 2, 4,8, 9, 17, 24. 



44. Utilisation d'au moins un fragment nucleotidique, pour tester 
I'efficacite d'un agent therapeutique pour un etat pathologique associd a une maladie 

10 degenerative et/ou neurologique et/ou auto-immune, selon laquelle ledit fragment 
nucleotidique est choisi parmi les fragments qui cedent pour au moins un fragment 
d'une proteine, ladite proteine etant choisie parmi les proteines dont la sequence 
peptidique a I'etat natif correspond a SEQ ID N° I, SEQ ID N° 2, SEQ ID N° 3. SEQ 
ID N*=» 4, SEQ ID N*' 5, SEQ ID N° 6, SEQ ID N° 7, SEQ ID N° 8, SEQ IDN° 9, SEQ 

15 ID 10, SEQ ID 1 1, SEQ ID N° 12, SEQ ID N° 13, SEQ ID N** !4, SEQ ID N** 
15. SEQ ID N° 16. SEQ ID N° 17, SEQ ID N** 18. SEQ ID N° 19, SEQ ID N*' 20, 
SEQ ID N*^ 21, SEQ ID N** 22, SEQ ID N** 23. SEQ ID N'* 24, SEQ ID N** 25, SEQ ID 
N*' 26, SEQ ID N° 27, SEQ ID N° 28 et SEQ ID N** 29, les sequences peptidiques qui 
presentent au moins 70 % d'identite, de preference au moins 80 % et avantageusement 

20 au moins 98 % d'identite avec Tune quelconque des sequences peptidiques SEQ ID N" 
1 a 29, et les fragments complementaires desdits fragments et les fragments qui codent 
pour les sequences peptidiques ou les fragments desdites sequences appartenant a une 
meme famille de proteines choisie parmi le perlecan, le precurseur de la proteine 
plasmatique de liaison au retinol, du precurseur de Pactivateur du ganglioside GM2, de 

25 la calgranuline B et de la saposine B. 



45. Utilisation pour tester TefFicacite d'un agent therapeutique pour un 
etat pathologique associe a une maladie degenerative et/ou neurologique et/ou auto- 
immune, de proteines recombinantes et/ou codecs par tout ou partie des fragments 
30 nucleotidiques deflnis a la revendication 44. 




46. Utilisation d'au moins un fragment nucleotidique pour la preparation 
d'une composition pharmaceutique destinee au traitement d'une maladie degenerative 
et/ou neurologique et/ou auto-immune, telle que la sclerose en plaques, selon laquelle 
ledit fragment nucleotidique est choisi parmi des fragments qui codent pour au moins un 
5 fragment d'une proteine, ladite proteine etant choisie parmi les proteines dont la 
sequence peptidique a Tetat natif correspond a SEQ ID N° 1, SEQ ID N° 2, SEQ ID N° 
3, SEQ ID N° 4. SEQ ID N** 5. SEQ ID N*' 6, SEQ ID N*' 7, SEQ ID N° 8, SEQ IDN° 
9, SEQ ID N° 10, SEQ ID N** 1 1, SEQ ID N° 12, SEQ ID N*' 13, SEQ ID 14, SEQ 
ID N° 15, SEQ ID N° 16, SEQ ID N** 17, SEQ ID N° 18, SEQ ID N° 19, SEQ ID N° 

10 20, SEQ ID N° 21, SEQ ID 22, SEQ ID N° 23, SEQ ID N*^ 24, SEQ ID N° 25, 
SEQ ID 26, SEQ ID N° 27, SEQ ID N° 28 et SEQ ID N° 29, les sequences 
peptidiques qui presentent au moins 70 % d'identite, de preference au moins 80 % et 
avantageusement au moins 98 % d'identite avec Tune quelconque des sequences 
peptidiques SEQ ID N° I a 29, et les fragments complementaires desdits fragments et 

15 les fragments qui codent pour les sequences peptidiques ou les fragments desdites 
sequences appartenant a une meme famille de proteines choisie parmi le perlecan, le 
precurseur de la proteine plasmatique de liaison au retinol, du precurseur de Tactivateur 
du ganglioside GM2, de ia calgranuline B et de la saposine B. 

20 47. Utilisation pour la preparation d'une composition pharmaceutique 

destinee au traitement d'une maladie degenerative et/ou neurologique et/ou auto- 
immune, telle que la sclerose en plaques, de proteines recombinantes et/ou codecs par 
tout ou partie des fragments nucleotidiques defmis a la revendication 46. 

25 48. Utilisation selon la revendication 44 ou 46, caracterisee en ce que ledit 

fragment nucleotidique code pour ladite proteine. 
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49. Utilisation selon la revendication 48, caracterisee en ce que la sequence 
peptidique de ladite proteine a Tetat natif consiste en une sequence choisie parmi I'une 
quelconque des SEQ ID N** 1 a 29, les sequences peptidiques qui presentent au moins 
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70 % d'identite de preference au moins 80 % d'identite et avantageusement au moins 98 
d'identite avec Tune quelconque des sequences peptidiques SEQ ID N° 1 a 29, et les 
sequences peptidiques ou les fragments desdites sequences appartenant a une meme 
famille de proteines choisies parmi le perlecan, ]e precurseur de la proteine plasmatique 
5 de liaison au retinol, du precurseur de Tactivateur du ganglioside GM2, de la 
calgranuline B et de la saposine B. 

50. Utilisation selon la revendication 49, caracterisee en ce que les 
polypeptides sent choisis parmi SEQ ID N*" 2. 4, 8, 9, 17. 24. 

10 

51. Utilisation u'au ivioins un fragiiient nucleotidique, pour tester 
refficacite d*un agent therapeutique pour un etat pathologique associe a une maladie 
degenerative et/ou neurologique et/ou auto-immune selon laquelle ledit fragment est un 
fragment d'une sequence nucleique choisie parmi Tune quelconque des SEQ ED N® 30, 

15 SEQ ID N° 3 1, SEQ ID 32, SEQ ID N° 33, SEQ ID N° 34, SEQ ID N** 35. SEQ ID 
N° 36, SEQ ID N° 37, SEQ ID N° 38. SEQ ID N° 39. SEQ ID N*> 40, SEQ ID N° 41, 
SEQ ID 42, SEQ ID N° 43. SEQ ID N*" 44, SEQ ID N° 45, SEQ ID N° 46 et SEQ 
ID N*' 47, SEQ ID 48. SEQ ID N° 49 et SEQ ID N° 50, SEQ ID N** 51, SEQ ID N*» 
52, SEQ ID N** 53. SEQ ID N° 54, SEQ ID N« 55, SEQ ID N° 56, SEQ ID N° 57, 

20 SEQ ID N° 66. SEQ ID N° 67, SEQ ID N° 68, SEQ ID N° 69, SEQ ID N°70 , SEQ ID 
N° 71, et leurs sequences complementaires. 



52. Utilisation d'au moins un fragment nucleotidique pour la preparation 
d'une composition pharmaceutique destinee au traitement d'une maladie degenerative 

25 et/ou neurologique et/ou auto-immune, telle que la sclerose en plaques selon laquelle 
ledit fragment est un fragment d'une sequence nucleique choisie parmi Tune quelconque 
des SEQ ID N° 30. SEQ ID N*' 31. SEQ ID N° 32, SEQ ID N** 33, SEQ ID N** 34, 
SEQ ID 35, SEQ ID N° 36, SEQ ID N° 37, SEQ ID N** 38, SEQ ID 39, SEQ ID 
N° 40, SEQ ID N** 41, SEQ ID N° 42, SEQ ID N*' 43, SEQ ID N° 44. SEQ ID N** 45, 

30 SEQ ID N° 46 et SEQ ID N° 47, SEQ ID N° 48; SEQ ID N° 49 et SEQ ID N° 50. SEQ 
ID N° 51, SEQ ID N° 52, SEQ ID N° 53, SEQ ID N° 54, SEQ ID N° 55, SEQ ID 
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56, SEQ ID N** 57, SEQ ID 66, SEQ ID N°67, SEQ ID N** 68, SEQ ID N° 69, SEQ 
ID N°70 , SEQ ID N° 71, et leurs sequences complementaires. 

53. Utilisation selon la revendication 51 ou 52, caracterisee en ce que la 
5 sequence nucleique est choisie parmi SEQ ID N*' 30, 3 1, 42, 53. 

54. Utilisation de la lycorine pour la preparation d'une composition pour la 
prevention et/ou le traitement de maladie degenerative et/ou neurologique et/ou auto- 
immune. 
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De preference, ledit fragment nucleotidique code pour une proteine qui a 
Tetat natif consiste en une sequence choisie parmi I'une quelconque des SEQ ID N®s 1 a 
8 et SEQ ID N°s 10 a 29 precitees, et parmi les sequences peptidiques ou les fragments 
desdites sequences appartenant a une meme famille de proteines choisies parmi le 
5 perlecan, le precurseur de la proteine plasmatique de liaison au retinol, du precurseur de 
Tactivateur du ganglioside GM2, de la calgranuiine B et de ia saposine B. 

Un autre objet de T invention est 1' utilisation d'au moins un fragment 
nucleotidique pour obtenir une composition diagnostique, pronostique, prophylactique 

10 ou thdrapeutique destinee a detecter, pronostiquer, prevenir ou traiter un etat 
pathologique associe a une maladie degenerative et/ou neurologique et/ou auto-immune 
selon laquelle ledit fragment est un fragment d'une sequence nucleique choisie parmi 
Tune quelconque des SEQ ID N° 30, SEQ ID N° 31, SEQ ID N° 32, SEQ ID N° 33, 
SEQ ID N° 34, SEQ ID N° 35, SEQ ID N° 36, SEQ ID N° 37, SEQ ID N° 38, SEQ ID 

15 N° 39, SEQ ID N° 40, SEQ ID 41, SEQ ID N° 42, SEQ ID N° 43, SEQ ID N° 44, 
SEQ ID N° 45, SEQ ID N*' 46 et SEQ ID N'' 47, SEQ ID N° 48, SEQ ID N° 49 et SEQ 
ID N° 50, SEQ ID N° 51, SEQ ID 52, SEQ ID N° 53. SEQ ID N° 54, SEQ ED N° 
55, SEQ ID N** 56, SEQ ID 57, SEQ ID 67. SEQ ID 66. SEQ ID N° 69. 
SEQ ID N® 70 et SEQ ID N** 71 et leurs sequences complementaires. 

20 

L'invention conceme egalement I'utilisation d'un ligand specifique d'un 
polypeptide ou d'un fragment nucleotidique tel que defmi ci dessus pour obtenir une 
composition diagnostique, pronostique, prophylactique ou therapeutique destinee a 
detecter, pronostiquer, prevenir ou traiter un etat pathologique associe a une maladie 

25 degenerative et/ou auto-immune. 

Par ligand, on entend toute molecule susceptible de s'associer au 
polypeptide, tel que un anticorps monoclonal, un anticorps polyclonal, un recepteur, un 
substrat d'acti>ate enzymatique, une enzyme dont ledit polypeptide est un co-facteur. La 
production d' anticorps polyclonaux et monoclonaux fait partie des connaissances 

30 g6n6rales de Thomme du metier. On peut citer a titre de reference Kdhler G. et Milstein 
C. (1975) : Continuous culture of fused cells secreting antibody of predefined 
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peptidiques ou les fragments desdites sequences appartenant a une meme famille de 
proteines choisies parmi le perlecan, le precurseur de la proteine plasmatique de liaison 
au retinol, du precurseur de I'activateur du ganglioside GM2, de la calgranuline B et de 
la saposine B. 

5 L' invention concerne egalement un nouveau polypeptide qui comprend au 

moins un fragment d'une proteine dont la sequence peptidique correspond a SEQ ID N** 
9, ledit fragment presentant au moins une mutation, en particulier au moins deux 
mutations par rapport a la sequence de reference SEQ ID 8. Le polypeptide est 
avantageusement choisi parmi les polypeptides qui comprennent la sequence en acides 

10 amines FSWDNCFEGKDPAVIR, referencee SEQ ID N** 68 et la sequence en acides 
amines YSLPKSEFAVPDLELP, referencee SEQ ID N° 72. 

En particulier, ledit polypeptide comprend ou consiste en SEQ ED N** 9. Ce 
polypeptide est utilise pour obtenir une composition diagnostique, pronostique, 
prophylactique ou therapeutique destinee a detecter, pronostiquer, prevenir ou trailer un 

15 etat pathologique associe a une maladie degenerative et/ou auto-immune, seul ou en 
melange avec au moins un polypeptide tel que defmi precedemment. 

L*un des objet de Tinvention est egalement un fragment nucleotidique qui 
code pour le fragment de la proteine dont la sequence peptidique correspond i SEQ ID 
N** 9, ledit fragment de ladite proteine presentant au moins une mutation, en particulier 

20 deux mutations par rapport a la sequence de reference SEQ ID N° 8. Ledit fragment 
nucl6otidique, en particulier, comprend ou consiste en un fragment qui code pour SEQ 
ID N° 9. Ce fragment est utilise pour obtenir une composition diagnostique, 
pronostique, prophylactique ou therapeutique destinee a detecter, prevenir ou traiter un 
etat pathologique associe a une maladie degenerative et/ou auto-immune, seul ou en 

25 melange avec au moins un fragment nucleotidique tel que defini precedemment. 

L*invention a aussi pour objet un procede pour detecter au moins un ligand 
associe a une maladie degenerative et/ou auto-immune, dans un echantillon biologique, 
selon lequel on met en contact Techantillon Jbiologique avec au moins le polypeptide qui 
comprend ou consiste en SEQ ID N° 9 ou un melange de polypeptides comprenant ce 

30 polypeptide et au moins un polypeptide tel que decrit ci dessus, puis on detecte la 
formation d'un complexe ou de complexes entre le ou les polypeptides et le ou les 




- Utilisation pour la preparation d*une composition pharmaceutique 
destinee au traitement d'une maladie degenerative et/ou neurologique et/ou auto- 
immune, telle que la sclerose en plaques, de proteines recombinantes et/ou codecs par 
tout ou partie des fragments nucleotidiques definis au paragraphe precedent ; 

Avantageusement, ledit fragment nucleotidique utilise code pour ladite 

proteine ; 

De preference, la sequence peptidique de ladite proteine a I'etat natif 
consiste en une sequence choisie parmi Tune quelconque des SEQ ID N° 1 a 29, les 
sequences peptidiques qui presentent au moins 70 % d*identite de preference au moins 
80 % d'identite et avantageusement au moins 98 d'identite avec Tune quelconque des 
sequences peptidiques SEQ ID 1 a 29, et les sequences peptidiques ou les fragments 
desdites sequences appartenant a une meme famille de proteines choisies parmi le 
perlecan, le precurseur de la proteine plasmatique de liaison au retinol, du precurseur de 
Tactivateur du ganglioside GM2, de la calgranuline B et de la saposine B. Les 
polypeptides sont preferentiellement choisis parmi SEQ ID N° 2, 4, 8, 9, 17, 24. 

- Utilisation d*au moins un fragment nucleotidique, pour tester TefFicacite 
d'un agent therapeutique pour un etat pathologique associe a une maladie degenerative 
et/ou neurologique et/ou auto-immune selon laquelle ledit fragment est un fragment 
d'une s^uence nucleique choisie parmi Tune quelconque des SEQ ID N° 30, SEQ ID 

31, SEQ ID N** 32, SEQ ID N° 33, SEQ ID N° 34, SEQ ID N° 35, SEQ ID N** 36, 
SEQ ID N° 37, SEQ ID N° 38, SEQ ID N° 39, SEQ ID N** 40, SEQ ID N° 41, SEQ ID 
N° 42, SEQ ID N° 43, SEQ ID 44, SEQ ED N*' 45, SEQ ID 46 et SEQ ID 47, 
SEQ ID N° 48, SEQ ID N° 49 et SEQ ID N** 50, SEQ ID 51, SEQ ID 52, SEQ 
ID 53, SEQ ID N° 54, SEQ ID N° 55, SEQ ID 56, SEQ ID N° 57, SEQ ID N° 
66, SEQ ID N° 67, SEQ ID N° 69, SEQ ID N°70 , SEQ ID N*' 71, et leurs sequences 
complementaires. 

-Utilisation d'au moins un fragment nucleotidique 
pour la preparation d'une composition pharmaceutique destinee au trmtement 
d*une maladie degenerative et/ou neurologique et/ou auto-immune, telle que la sclerose 
en plaques selon laquelle ledit fragment est un fragment d'une sequence nucleique 
choisie parmi Tune quelconque des SEQ ID N° 30, SEQ ID N** 3 1, SEQ ID 32, SEQ 
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GCCACGCCCCAGCCCGACAATGTCGAGTATATTATTATTAATATTATTATGAATTTTTGTAA 
GAAACCGAGGCGATGCCACGCTTTGCTGCTACCGCCCTGGGCTGGACTGGAGGTGGGCATG 
CCACCCTCACACACACAGCTGGGCAAAGCCACAAGGCTGGCCAGCAAGGCAGGTTGGATG 
GGAGTGGGCACCTCAGAAAGTCACCAGGACTTGGGGTCAGGAACAGTGGCTGGGTGGGCC 
5 CAGAACTGCCCCCACTGTCCCCCTACXrCACCGATGGAGCCCCCAGATAGAGCTGGGTGGCC 
TGTTTCTGCAGCCCTTGGGCAGTTCTCACTCCTAGGAGAGCCAACCTCGGCTTGTGGGCTGG 
TGCCCCACAGCTACCTGAGACGGGCATCGCAGGAGTCTCTGCCACCCACTCAGGATTGGGA 
ATTGTCTTTAGTGCCGGCTGTGGAGCAAAAGGCAGCTCACCCCTGGGCAGGCGGTCCCCAT 
CCCCACCAGCTCGTTTTTCAGCACCCCCACCCACCTCCACCCAGCCCCTGGCACCTCCTCTG 

10 GCAGACTCCCCCTCCTACCACGTCCTCCTGGCCTGCATTCCCACCCCCTCCTGCCAGCACAC 
AGCCTGGGGTCCCTCCCTCAGGGGCTGTAAGGGAAGGCCCACCCCAACTCTTACCAGGAGC 
TGCTACAGGCAGAGCCCAGCACTGATAGGGCCCCGCCCACCGGGCCCCGCCCACCCCAGGC 
CACATCCCCACCCATCTGGAAGTGAAGGCCCAGGGACTCCTCCAACAGACAACGGACGGAC 
GGATGCCGCTGGTGCTCAGGAAGAGCTAGTGCCTTAGGTGGGGGAAGGCAGGACTCACGA 

15 CTGAGAGAGAGAGGAGGGGGATATGACCACCCTGCCCCATCTGCAGGAGCCTGAAGATCC 
AGCTCAAGTGCCATCCTGCCAGTGGCCCCCAGACTGTGGGGTTGGGACGCCTGGCCTCTGT 
GTCCTAGAAGGGACCCTCCTGTGGTCTTTGTCTTGATTTTTCTTAATAAACGGTGCTATCCC 
CGCC 

20 GM2 activateur 

SEQ ID 58 IPTGEPCPEP LRTYG 
SEQ ID 59 lESVLSSSGK RLG 
SEQ ID 60 ATPAQAHLKK PSQLSSFS 

25 Saposine B 

SEQ ID 61 RIQAMIPKGA LRVA V 
SEQ ID 62 GICQCLAERY SVILL 

Calgranuline B 
30 SEQ ID 63 EKMHEGDEGP GHHHKPG 
SEQ ID 64 DLQNFLKKEN KNE 
SEQ ID 65 VKLGHPDTLN QGEFKELVR 



35 Peptide mut£ 1 

SEQ ID N° 68 FSWDNCFEGK DPA VIR 

SEQ ID N»66 TTYWSNTGGG AYAAYTGYTT YGARGGNAAR GAYCCNGCNG TNATHMGN 

40 

Peptide mute 2 

SEQ ID N° 72 YSLPKSEFAV PDLELP 

45 SEQ ID N'*67 TAYWSNYTOC CNA ARWSNGA RTTYGCNGTN CCNGAYYTNG ARYTNCCN 

SEQ ID N** 69 > NAME = 'Reverse-Translation of PERLECAN' : TYPE = DNA 
GAYGCNCCNGGNCARTAYGGNGCNTAYTr/CAYGAYGAYGGKTTYYTNGCNTTYCCNGGN 
CAYGTNTIVWS^^V^G^rWS^^^mCCNGARGTNCCNGARACNATHGARYTNG/^ 
50 WSNACNGCNWSNGGhrYTTsrmmWGGCARGGNGTNGARGT^ 

AARGAYTIYATHWSNYTNGGKYn^CARGAYGGNCAYYTNGTKrr^ 

WSNGGNGARGCNMGNYTNGTNWSNGARGAYCCNATHAAYGAYGGNGARTGGCAYMGNGT 

NACNGCmTNMGNGARGGNMGNMGNGGNWSNMGNCARGTNGAYGGNGARGARYTNG^ 

WSNGGNMG^4WSNCCNGGNCCNAAYGTNGCNGTNAAYGCNAARGGNWSNGTNTAYATHGG 




9. Utilisation selon la revendication 8, caracterisee en ce que ledit fragment 
nucleotidique code pour ladite proteine. 

10. Utilisation selon la revendication 9, caracterisee en ce que la sequence 
5 peptidique de ladite proteine a Tetat natif consiste en une sequence choisie panni Tune 

quelconque des SEQ ID N° 1 a 8 et SEQ ID N*' 10 a 29 et les sequences peptidiques ou 
les fragments desdites sequences appartenant k une meme famille de proteines choisies 
parmi le perlecan, le precurseur de la proteine plasmatique de liaison au retinol, du 
precurseur de Tactivateur du ganglioside GM2, de ta^calgranuline B et de la saposine B. 

10 

1 1 . Utilisation d'au moins un fragment nucleotidique pour obtenir une 
composition diagnosdque, pronostique, prophylactique ou therapeutique destin^ a 
detecter, pronostiquer, prevenir ou traiter un etat pathologique associe a une maladie 
degenerative et/ou neurologique et/ou auto-immune selon laquelle ledit fragment est un 

15 fragment d'une sequence nucleique choisie parmi Tune quelconque des SEQ ED N° 30, 
SEQ ID N° 3 1, SEQ ID N° 32, SEQ ID N° 33, SEQ ID N° 34, SEQ ID N° 35, SEQ ID 
N° 36, SEQ ID N** 37, SEQ ID N° 38, SEQ ID N° 39. SEQ ID N° 40, SEQ ID N° 41, 
SEQ ID N° 42, SEQ ID N** 43, SEQ ID N*' 44, SEQ ID N° 45, SEQ ID N° 46 et SEQ 
ID 47, SEQ ID N° 48, SEQ ID N° 49 et SEQ ID N° 50, SEQ ID N*» 51, SEQ ID N** 

20 52, SEQ ID N° 53, SEQ ID 54, SEQ ID N** 55, SEQ ID N° 56, SEQ ID N** 57, 
SEQ ID N*' 67, SEQ ID N° 66, SEQ ID N*' 69, SEQ ID N° 70 et SEQ ID N° 71 et leurs 
sequences complementaires. 

12. Utilisation d'un ligand specifique d'un polypeptide ou d*un fragment 
25 nucleotidique selon I'une quelconque des revendi cations precedentes pour obtenir une 

composition diagnostique, pronostique, prophylactique ou therapeutique destinee a 
detecter, pronostiquer, prevenir ou traiter un etat pathologique associe a une maladie 
degenerative et/ou neurologique et/ou auto-immune. 
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21. Precede selon Tune quelconque des revendications 14 a 20, caracterise 
en ce que la maladie degenerative et/ou auto-immune est la sclerose en plaques. 

22. Polypeptide caracterise en ce qu'il comprend au moins un fragment 
d'une proteine dont la sequence peptidique correspond a SEQ ID N° 9, ledit fragment 
comprenant au moins une mutation par rapport a la sequence de reference SEQ ID N° 8. 

23. Polypeptide selon la revendication 22, caracterise en ce qu'il comprend 
au moins deux mutations par rapport a la sequence de reference SEQ ID N** 8. 

24. Polypeptide selon la revendication 22, caracterise en ce qu'il est choisi 
parmi les polypeptides qui comprennent la sequence en acides amines 
FSWDNCFEGKDPAVIR, referencee SEQ ID N° 68 et la sequence en acides amines 
YSLPKSEFAVPDLELP, referencee SEQ ID N° 72. 

25. Polypeptide selon Tune des revendications 22 a 24, caracterise en ce 
qu'il comprend une proteine dont la sequence peptidique correspond a SEQ ID N** 9. 

26. Polypeptide selon Tune des revendications 22 a 25, caracterise en ce 
qu'il consiste en une proteine dont la sequence peptidique correspond a SEQ ID 9. 

27. Utilisation d'au moins un polypeptide selon Tune quelconque des 
revendications 22 a 26 pour obtenir une composition diagnostique, pronostique, 
prophylactique ou therapeutique destinee a detecter, pronostiquer, prevenir ou traiter un 
etat pathologique associe a une maladie degenerative et/ou neurologique et/ou auto- 
immune. 

28. Utilisation selon la revendication 26, caracterisee en ce que le 
polypeptide tel que defini dans I'une quelconque des revendications 22 a 26 est utilise en 
melange avec au moins un polypeptide tel que defini dans I'une quelconque des 
revendications 1 a 5. 
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70 % d*identite de preference au moins 80 % d'identite et avantageusement au moins 98 
d'identite avec I'une quelconque des sequences peptidiques SEQ ID N*^ 1 a 29, et les 
sequences peptidiques ou les fragments desdites sequences appartenant a une meme 
famille de proteines choisies parmi le perlecan, le precurseur de la proteine plasmatique 
5 de liaison au retinol, du precurseur de Tactivateur du ganglioside GM2, de la 
calgranuline B et de la saposine B. 

50. Utilisation selon la revendication 49, caracterisee en ce que les 
polypeptides sont choisis parmi SEQ ID N° 2, 4, 8, 9, 17, 24. 

10 

51. Utilisation d*au moins un fragment nucleotidique, pour tester 
Tefficacite d'un agent therapeutique pour un etat pathologique associe a une maladie 
degenerative et/ou neurologique et/ou auto-immune selon laquelle ledit fragment est un 
fragment d'une sequence nucleique choisie parmi I'une quelconque des SEQ ID 30, 

15 SEQ ID N° 3 1, SEQ ID 32, SEQ ID N° 33, SEQ ID N° 34, SEQ ID N° 35, SEQ ID 
36, SEQ ID N° 37, SEQ ID N° 38, SEQ ID N° 39, SEQ ID N° 40, SEQ ID N° 41, 
SEQ ID N° 42, SEQ ID N° 43, SEQ ID N° 44, SEQ ID N° 45, SEQ ID N° 46 et SEQ 
ID N° 47, SEQ ID N*' 48, SEQ ID 49 et SEQ ID N° 50, SEQ ID N° 51. SEQ ID N** 
52, SEQ ID N° 53, SEQ ID 54, SEQ ID N*' 55, SEQ ID N° 56, SEQ ID N° 57, 

20 SEQ ID N° 66, SEQ ED N° 67. SEQ ID N° 69, SEQ ID N^70 . SEQ ID N*» 71, et leurs 
sequences complementaires. 

52. Utilisation d'au moins un fragment nucleotidique pour la preparation 
d*une composition pharmaceutique destinee au traitement d'une maladie degenerative 

25 et/ou neurologique et/ou auto-immune, telle que la sclerose en plaques selon laquelle 
ledit fragment est un fragment d*une sequence nucleique choisie parmi I'une quelconque 
des SEQ ID N*' 30, SEQ ID N° 31, SEQ ID N° 32, SEQ ID N° 33, SEQ ID N° 34, 
SEQ ID N° 35. SEQ ID 'N'* 36, SEQ ID 37, SEQ ID N° 38, SEQ ID N° 39, SEQ ID 
N° 40, SEQ ID N° 41, SEQ ID 42, SEQ ID N° 43, SEQ ID N° 44, SEQ ID N° 45, 

30 SEQ ID N'* 46 et SEQ ID N° 47, SEQ ID 48, SEQ ID N'' 49 et SEQ ID N** 50, SEQ 
ID N° 51, SEQ ID N° 52, SEQ ID 53. SEQ ID N° 54, SEQ ID N° 55, SEQ ID N° 
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56, SEQ ID N° 57, SEQ ID N*' 66, SEQ ID N°67. SEQ ID N° 69, SEQ ID N^'TO , SEQ 
ID N° 71, et leurs sequences complementaires. 

53. Utilisation selon la revendication 51 ou 52, caracterisee en ce que la 
sequence nucleique est choisie parmi SEQ ID N° 30. 3 1, 42, 53. 

54. Utilisation de la lycorine pour la preparation d'une composition pour la 
prevention et/ou le traitement de maladie degenerative et/ou neurologique et/ou auto- 
inrunune. 



Avantageusement les cinq polypeptides qui repondent a la definition precedente sent 
utilises en combinaison. 

De preference, la sequence peptidique dudit polypeptide comprend, ou 
consiste en une sequence choisie parmi Tune quelconque des SEQ ID N** 2, SEQ ID N** 
5 4, SEQ ID N° 8, SEQ ID N° 17 et SEQ ID N° 24. 

L*invention concerne encore rutilisation d'an moms un fragment d'un des 
polypeptiques precites pour la preparation d*un peptide immunogene, ledit peptide 
comprenant tout ou partie d'au moins une des sequences referencees SEQ ID N°s 58 a 
65 et etant utilise pour la production d*anticorps monoclonaux. 

10 L* invention a egalement pour objel, T utilisation d'mi moms un fragment 

nucleotidique» pour obtenir une composition diagnostique, pronostique, prophylactique 
ou therapeutique destinee a detecter, pronostiquer, prevenir ou traiter un etat 
pathologique associe a une maladie degenerative et/ou auto-immune, selon laquelle ledit 
fragment nucleotidique est choisi parmi des fragments qui codent pour au moins un 

15 fragment d'une proteine, ladite proteine etant choisie parmi les proteines dont la 
sequence peptidique a Tetat natif correspond a SEQ ID N° 1, SEQ ID N° 2, SEQ ID N"* 
3, SEQ ID N° 4, SEQ ID 5, SEQ ID N° 6, SEQ ID N° 7, SEQ ID N° 8, SEQ ID N*^ 
10, SEQ ID N° 11, SEQ ID N° 12, SEQ ID N° 13, SEQ ID N° 14, SEQ ID N° 15. 
SEQ ID N° 16, SEQ ID N*' 17, SEQ ID N** 18, SEQ ID N° 1 9, SEQ ID N° 20, SEQ ID 

20 N° 21, SEQ ID 22, SEQ ID N'^ 23. SEQ ID N° 24. SEQ ID N° 25, SEQ ID N** 26, 
SEQ ED N** 27, SEQ ID N° 28 ET SEQ ID N** 29 et les sequences peptidiques qui 
present ent au moins 70 % d'identite, de preference au moins 80 % et avantageusement 
au moins 98 % d'identite avec Tune quelconque des sequences peptidiques ci dessus, et 
les fragments complementaires desdits fragments, et les sequences peptidiques ou les 

25 fragments desdites sequences appartenant a une meme famille de proteines choisies 
parmi le perlecan, le precurseur de la proteine plasmatique de liaison au retinol, du 
precurseur de I'activateur du ganglioside GM2, de la calgranuline B et de la saposine B. 
II est a la portee de Thomme du metier de determiner les sequences nucleiques des 
fragments nucleotidiques a partir des sequences peptidiques et du code genetique. ceci 

30 faisant partie de ses connaissances generales. 

Avantageusement, le fragment nucleotidique precite code pour ladite proteine. 



peptidiques ou les fragments desdites sequences appartenant a une meme famille de proteines 
choisies parmi le perlecan, le precurseur de la proteine plasmatique de liaison au retinol, du 
precurseur de Tactivateur du ganglioside GM2, de la calgranuline B et de la saposine B. 

De preference, rechantiilon biologique est Turine, le liquide de cephalo- 
5 rachidien ou le serum. 

L 'invention concerne egalement un nouveau polypeptide qui comprend au 
moins un fragment d'une proteine dont la sequence peptidique correspond a SEQ ID N° 
9, ledit fragment presentant au moins une mutation, en particulier au moins deux 
mutations par rapport a la sequence de reference SEQ ID N° 8. Le polypeptide est 

10 avantageusement choisi parmi les polypeptides qui comprennent la sequence en acides 
amines FSWDNCFEGKDPAVIR, referencee SEQ ID N° 68 et la sequence en acides 
amines YSLPKSEFAVPDLELP, referencee SEQ ID N** 69. 

En particulier, ledit polypeptide comprend ou consiste en SEQ ID N*' 9. Ce 
polypeptide est utilise pour obtenir une composition diagnostique, pronostique, 

15 prophylactique ou therapeutique destinee a detecter, pronostiquer, prevenir ou trailer un 
etat pathologique associe a une maladie degenerative et/ou auto-immune, seul ou en 
melange avec au moins un polypeptide tel que defini precedemment. 

L'un des objet de 1' invention est egalement un fragment nucleotidique qui 
code pour le fragment de la proteine dont la sequence peptidique correspond a SEQ ID 

20 N° 9, ledit fragment de ladiie proteine presentant au moins une mutation, en particulier 
deux mutations par rapport a la sequence de reference SEQ ID N° 8. Ledit fragment 
nucleotidique, en particulier, comprend ou consiste en un fragment qui code pour SEQ 
ID N** 9. Ce fragment est utilise pour obtenir une composition diagnostique, 
pronostique, prophylactique ou therapeutique destinee a detecter, prevenir ou traiter un 

25 etat pathologique associe a une maladie degenerative et/ou auto-immune, seul ou en 
melange avec au moins un fragment nucleotidique tel que defmi precedemment. 

L'invention a aussi pour objet un procede pour detecter au moins un ligand 
associe a une maladie degenerative et/ou auto-immune, dans un echantillon biologique, 
selon lequei on met en contact I'echantillon biologique avec au moins le polypeptide qui 

30 comprend ou consiste en SEQ ID N"" 9 ou un melange de polypeptides comprenant ce 
polypeptide et au moins un polypeptide tel que decrit ci dessus, puis on detecte la 
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formation d'un complexe ou de complexes entre le ou les polypeptides et le ou les 
ligands correspondants ; etant entendu que par ligand on entend une molecule qui 
repond aux conditions precitees. 

L' invention concerne egalement un procede pour detecter au moins le 
5 polypeptide reference SEQ m N° 9 ou un fragment dudit polypeptide, ce fragment 
comprenant au moins une et de preference deux mutations par rapport a la sequence de 
refernce SEQ ID N°8, dans un echantillon biologique selon lequel on met en contact 
Techantillon biologique avec au moins un ligand specifique dudit polypeptide, puis on 
detecte la formation d'un complexe entre ledit polypeptide et ledit ligand. La definition 
10 de ligand correspond a celle definie precedemment. II peut s'agir entre autres d'un 
anticorps monolonal , d'un anticorps polyclonal, d'un substrat d'activite enzymatique, 
ou d'une enzyme dont ledit polypeptide est un cofacteur, d'un recepteur. 

On peut egalement mettre en contact Pechantillon biologique avec un ligand 
specifique du polypeptide reference SEQ ID N°9 et au moins un ligand specifique d'au moins un 
15 autre polypeptide tel que defmi precedemment, puis on detecte la formation de complexes entre 
lesdits polypeptides et lesdits ligands specifiques desdits polypeptides ; etant entendu que par 
ligand on entend une molecule qui repond aux conditions decrites precedemment. 

De preference, I'echantillon biologique est Turine, le liquide de cephalo- 
rachidien ou le serum. 

20 Un autre objet de T invention est un fragment nucleotidique codant pour tout ou 

partie du polypeptide SEQ ID N'' 9, et son utilisation pour obtenir une composition diagnostique, 
pronostique, prophylactique ou therapeutique destinee a detecter, pronostiquer, prevenir ou 
traiter un etat pathologique associe a une maladie degenerative et/ou auto-immune, 
eventuellement en association avec au moins un fragment nucleotidique tel que defini 

25 precedemment, et les fragments complemcntaires desdits fragments. 

Par fragment polypeptidique, on entend au moins tout ou partie de la 
sequence peptidique d'une proteine, en particulier un fragment polypeptique qui 
comprend environ entre 5 et 15 acides amines et plus precisement environ entre 5 et 10 
acides amines et 6 et 15 acides amines. Et par fragment nucleotidique, on entend au 

30 moins tout ou partie d'une sequence nucleotidique, etant entendu que par sequence 
nucleotidique, sent couvertes les sequences ADN et ARN. 



ID N° 33, SEQ ID N° 34, SEQ ID N° 35, SEQ ID N° 36, SEQ ID N° 37, SEQ ID N° 
38, SEQ ID 39, SEQ ID N° 40, SEQ ID N'' 41, SEQ ID N° 42, SEQ ID N'* 43, 
SEQ ID N° 44, SEQ ID N° 45, SEQ ID 46 et SEQ ID N° 47, SEQ ID N<» 48, SEQ 
ID N° 49 et SEQ ID N° 50, SEQ ID N<> 51, SEQ ID N° 52, SEQ ID N° 53, SEQ ID N** 
54, SEQ ID N° 55, SEQ ID N° 56, SEQ ID N° 57, SEQ ID N*' 66, SEQ ID N°67, SEQ 
ID N° 69, SEQ ID N°70 , SEQ ID 71, et leurs sequences complementaires. 

La sequence nucleique est de preference choisie parmi SEQ ID N° 30, 31, 

42, 53. 

- Utilisation de la lycorine pour la preparation d'une composition pour la 
prevention et/ou le traitement de maladie degenerative et/ou neurologique et/ou auto- 
immune. 

Par efFicacite therapeutique, on entend le benefice clinique et biologique 
acquis apres administration d'un agent therapeutique en vue d'une amelioration, voire 
d*une guerison de la maladie. Ce benefice se traduit entre autre par une diminution des 
signes cliniques, biologiques, et des effets pathologiques de la maladie apres une analyse 
clinique par le medecin et/ou des analyses biologiques, telles que imagerie par resonance 
magnetique, analyse des bandes oHgocIonales dans le liquide cephalorachidien, analyse 
de potentiels evoques et le test de detection de gliotoxicite appele bio-essai, dont le 
principe est decrit dans la demande de brevet WO 98/1 1439 precedemment citee. Cette 
diminution des signes cliniques et effets pathologiques doit entrainer un benefice pour le 
patient (Schwartz et Lazar, 1995, Elements de statistique medicale et biologique, eds 
Flammarion ; Lazar et Schwartz, 1995, Elements de statistique medicale et biologique, 
eds Flammarion ). La maladie etudiee de preference est la sclerose en plaques. 

On entend par composition a usage prophylactique et/ou therapeutique^ 
toute composition qui comprend un agent therapeutiquement efficace. Ces agents 
therapeutiques sont capables (i) d'influencer de maniere qualitative et/ou quantitative 
!*activite biologique et/ou la fonction des proteines d'interet identifiees dans la presente 
invention, de preference Tactivite gliotoxlque et/ou (ii) de moduler et/ou d'inhiber 
I'expression de ces proteines et/ou (iii) de diminuer la concentration de ces proteines 
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REVENDICATIONS 

1. Utilisation d'au moins un polypeptide comprenant au moins un fragment 
5 d*une proteine pour obtenir una composition diagnostique, pronostique, prophylactique 

ou therapeutique destinee a detecter, prevenir ou traiter un etat pathologique associ^ a 
une maladie degenerative et/ou neurologique et/ou auto-immune, ladite proteine etant 
choisie parmi les proteines dont la sequence peptidique a Tetat natif correspond a SEQ 
ID N° 1, SEQ ID N° 2, SEQ ID N'' 3, SEQ ID N° 4, SEQ ID N° 5, SEQ ID N° 6, SEQ 

10 ID N'^ 7, SEQ ID 8, SEQ ID N° 10, SEQ ID N° 1 1, SEQ ID N'^ 12, SEQ ID N° 13, 
SEQ ID 14, SEQ ID N° 15, SEQ ID io, SEQ ID N° 17, SEQ ID N° 18. SEQ ID 
N° 19, SEQ ID IST' 20, SEQ ID N° 21, SEQ ID N** 22, SEQ ID 23, SEQ ID N*' 24, 
SEQ ID N*' 25, SEQ ID N° 26, SEQ ID N*' 27, SEQ ID N** 28 et SEQ ID 29, et les 
sequences peptidiques qui presentent au moins 70 % d'idenlite, de preference au moins 

15 80 % d'identite et avantageusement au moins 98 % d'identite avec Tune quelconque des 
sequences peptidiques SEQ ID 1 a SEQ ID N'* 8 et SEQ ID N° 10 a SEQ ID N** 29, 
et les sequences peptidiques ou les fragments desdites sequences appartenant a une 
meme famille de proteines choisies parmi le perlecan, le precurseur de la proteine 
plasmatique de liaison au retinol, du precurseur de Pactivateur du ganglioside GM2, de 

20 la calgranuHne B et de la saposine B. 

2. Utilisation d'au moins deux polypeptides en combinaison, lesdits 
polypeptides comprenant chacun au moins un fragment d'une proteine, pour obtenir une 
composition diagnostique, pronostique, prophylactique ou therapeutique destinee a 

25 detecter, prevenir ou traiter un etat pathologique associe a une maladie degenerative 
et/ou neurologique et/ou auto-immune, ladite proteine etant choisie parmi les proteines 
dont la sequence peptidique a I'etat natif correspond a une sequence peptidique choisie 
parmi SEQ ID N° 1 a SEQ ID N° 8 et SEQ ID N*' 10, SEQ ID N° 29, et les sequences 
peptidiques qui presentent au moins 70 % d*identite, de preference au moins 80 % 

30 d'identite et avantageusement au moins 98 % d'identite avec Tune quelconque des 
sequences peptidiques SEQ ID I a SEQ ID N*' 8 et SEQ ID N° 10 a SEQ ID 29. 
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et les sequences peptidiques ou les fragments desdites sequences appartenant a une 
meme famille de proteines choisies parmi le perlecan, le precurseur de la proteine 
plasmatique de liaison au retinol, du precurseur de Tactivateur du ganglioside GM2, de 
la calgranuline B et de la saposine B. 

5 

3. Utilisation d*au moins un polypeptide comprenant au moins un fragment 
d'une proteine pour obtenir une composition diagnostique, pronostique, prophylactique 
ou therapeutique destinee a detecter, prevenir ou trailer un etat pathologique associe a 
une maladie degenerative et/ou neurologique et/ou auto-immune, ladite proteine etant 

10 choisie parmi les proteines dont la sequence peptidique a Tetat natif correspond a SEQ 
ID N° 2, SEQ ID N° 4, SEQ ID N° 8, SEQ ID N° 1 7 et SEQ ID N° 24 et les sequences 
peptidiques qui presentent au moins 70 % d'identite, de preference au moins 80 % 
d'identite et avantageusement au moins 98 % d'identite avec Tune quelconque des 
sequences peptidiques SEQ ID N*' 2, SEQ ID 4, SEQ ID N° 8, SEQ ID N** 17 et 

15 SEQ ID N** 24. 

4. Utilisation selon la revendication 3, de cinq polypeptides en 
combinaison, lesdits polypeptides comprenant chacun au moins un fragment d'une 
proteine, pour obtenir une composition diagnostique, pronostique, prophylactique ou 

20 therapeutique destinee a detecter, pronostiquer, prevenir ou trailer un etat pathologique 
associe a une maladie degenerative et/ou neurologique et/ou auto-immune, ladite 
proteine etant choisie parmi les proteines dont la sequence peptidique a I'etat natif 
correspond a SEQ ID N° 2, SEQ ID N° 4, SEQ ID 8, SEQ ID 17 et SEQ ID N° 
24 et les sequences peptidiques qui presentent au moins 70 % d'identite, de preference 

25 au moins 80 % d'identite et avantageusement au moins 98 % d'identite avec Tune 
quelconque des sequences peptidiques SEQ ID N° 2,. SEQ ID N*' 4, SEQ ID N° 8, SEQ 
ID N° 17 et SEQ ID 24. 

5. Utilisation selon Tune quelconque des revendications 1 a 4, caracterisee 
30 en ce que la sequence peptidique dudit polypeptide comprend une sequence choisie 
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parmi Tune quelconque des SEQ ID N° 2. SEQ ID 4, SEQ ID N° 8, SEQ ID N° 17 
et SEQ ID N° 24. 

6. Utilisation seton Tune quelconque des revendications I a 4, caracterisee 
5 en ce que la sequence peptidique dudit polypeptide consiste en une sequence choisie 

parmi I'une quelconque des SEQ ID N° 2. SEQ ID N° 4, SEQ ID N° 8, SEQ ID N° 17 
et SEQ ID N** 24. 

7. Utilisation d'un fragment polypeptidique defini dans la revendication 1 
10 ou dans la revendication 3 pour la preparation d'un peptide immunogene, caracterise en 

ce que ledit peptide comprend tout ou partie d'au moins une des sequences referencee 
SEQ ID N° 58 a 65. 

8. Utilisation d'au moins un fragment nucleotidique, pour obtenir une 
15 composition diagnostique, pronostique, prophylactique ou therapeutique destinee a 

detecter, pronostiquer, prevenir ou trailer un etat pathologique associe a une maladie 
degenerative et/ou neurologique et/ou auto-immune, seion laquelle ledit fragment 
nucleotidique est choisi parmi des fragments qui cedent pour au moins un fragment 
d'une proteine, ladite proteine etant choisie parmi les proteines dont la sequence 

20 peptidique a I'etat natif correspond a SEQ ID N° 1, SEQ ID N° 2, SEQ ID N° 3, SEQ 
ID N° 4, SEQ ID N° 5, SEQ ID N° 6, SEQ ID N° 7, SEQ ID N° 8. SEQ ID N° 10, 
SEQ ID N*' 1 1, SEQ ID N° 12, SEQ ID N° 13. SEQ ID N° 14, SEQ ID N° 15, SEQ ID 
16, SEQ ID 17, SEQ ID N** 18, SEQ ID N° 19. SEQ ID N° 20, SEQ ID N° 21, 
SEQ ID N° 22, SEQ ID N*^ 23, SEQ ID N° 24. SEQ ID N° 25, SEQ ID N° 26, SEQ ID 

25 N** 27, SEQ ID N° 28 et SEQ ID N** 29 et les sequences peptidiques qui presentent au 
moins 70 % d'identite, de preference au moins 80 % et avantageusement au moins 98 % 
d'identite avec Tune quelconque des sequences peptidiques SEQ ID N° 1 a SEQ ID N° 
8 et SEQ ID N° 10 a 29, les fragments complementaires desdits fragments et les 
fragments qui codent pour les sequences peptidiques ou les fragments desdiles 

30 sequences appartenant a une meme famille de proteines choisie parmi le perlecan, le 
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precurseur de la proteine plasmatique de liaison au retinol, du precurseur de Tactivateur 
du ganglioside GM2, de la calgranuline B et de la saposine B. 

9. Utilisation selon la revendication 8, caracterisee en ce que iedit fragment 
5 nucleotidique code pour ladite proteine. 

10. Utilisation selon la revendication 9, caracterisee en ce que la sequence 
peptidique de ladite proteine a Tetat natif consiste en une sequence choisie parmi Tune 
quelconque des SEQ ID N° 1 a 8 et SEQ ID N° 10 a 29 et les sequences peptidiques ou 

10 les fragments desdites sequences appartenant a une meme famille de proteines choisies 
parmi le perlecan, le precurseur de la proteine plasmatique de liaison au retinol, du 
precurseur de Tactivateur du ganglioside GM2. de la calgranuline B et de la saposine B. 

11. Utilisation d'au moins un fragment nucleotidique pour obtenir une 
15 composition diagnostique, pronostique, prophylactique ou therapeutique destinee a 

detecter, pronostiquer, prevenir ou trailer un etat pathologique associe a une maladie 
degenerative et/ou neurologique et/ou auto-immune selon laquelle ledit fragment est un 
fragment d'une sequence nucleique choisie parmi Tune quelconque des SEQ ID N** 30. 
SEQ ID N° 31, SEQ ID N° 32, SEQ ID N° 33, SEQ ID N° 34, SEQ ID N° 35, SEQ ID 

20 N° 36, SEQ ID N° 37, SEQ ID N° 38, SEQ ID N° 39, SEQ ID N° 40, SEQ ID N° 41, 
SEQ ID N** 42. SEQ ID N° 43, SEQ ID N'^ 44, SEQ ID N° 45, SEQ ID N° 46 et SEQ 
ID N° 47, SEQ ID 48, SEQ ID N° 49 et SEQ ID N*^ 50, SEQ ID N° 5 1, SEQ ID N° 
52, SEQ ID 53. SEQ ID N° 54, SEQ ID N° 55, SEQ ID N° 56, SEQ ID N** 57. 
SEQ ID 67, SEQ ID N° 68. SEQ ID N° 69, SEQ ID N° 70 et SEQ ID N** 71 et leurs 

25 sequences complementaires. 

12. Utilisation d'un ligand specifique d'un polypeptide ou d*un fragment 
nucleotidique selon Tune quelconque des revendications precedentes pour obtenir une 
composition diagnostique, pronostique, prophylactique ou therapeutique destinee a 

30 detecter, pronostiquer. prevenir ou traiter un etat pathologique associe a une maladie 
degenerative et/ou neurologique et/ou auto-immune. 



13. Utilisation selon J'une quelconque des revendications precedentes, 
caracterisee en ce que la maladie degenerative et/ou auto-immune est la sclerose en 
plaques. 

5 

14. Precede pour detecter au moins una proteine associee a une maladie 
degenerative et/ou auto-immune, dans un echantillon biologique, caracterise en ce que 
Ton met en contact I'echantillon biologique avec au moins un ligand specifique d'au 
moins un polypeptide, ledit polypeptide comprenant au rnoins un fragment d'une 

10 proteine et ladite proteine etant choisie parmi les proteines dont la sequence peptidique a 
I'etat natif correspond a SEQ ID N** 1, SEQ ID 2, SEQ ID N° 3, SEQ ID 4, SEQ 
ID N° 5, SEQ ID N° 6, SEQ ID N° 7. SEQ ID N° 8, SEQ ID N*' 10, SEQ ID N° 1 1, 
SEQ ID N** 12, SEQ ID N** 13, SEQ ID N° 14, SEQ ID N*^ 1 5, SEQ ID N° 16, SEQ ID 
N° 17, SEQ ID N° 18, SEQ ID N° 19, SEQ ID N° 20, SEQ ID 21, SEQ ID 22, 

15 SEQ ID 23, SEQ ID N** 24, SEQ ID N*' 25, SEQ ID N° 26, SEQ ID N° 27, SEQ ID 
N° 28 et SEQ ID N'' 29 et les sequences peptidiques qui presentent au moins 70 % 
d'identite de preference au moins 80 % d'identite et avantageusement au moins 98 
d'identite avec Tune quelconque des sequences peptidiques SEQ ID N° 1 a SEQ ID N° 
8 et SEQ ED N° 10 a 29, et les sequences peptidiques ou les fragments desdites 

20 sequences appartenant a une meme famille de proteines choisies parmi le perlecan, le 
precurseur de la proteine plasmatique de liaison au retinol, du precurseur de Tactivateur 
du ganglioside GM2, de la calgranuline B et de la saposine B, puis on detecte la 
formation d'un complexe entre ledit polypeptide et ledit ligand. 

25 15. Procede selon la revendication 14, caracterise en ce que ledit ligand est 

un anticorps monoclonal, un anticorps polyclonal, un recepteur, un substrat d'activite 
enzymatique ou une enzyme dont ledit polypeptide est un cofacteur. 

16. Procede pour detecter au moins un ligand associe a une maladie 
30 degenerative et/ou auto-immune, dans un echantillon biologique, caracterise en ce que 
Ton met en contact 1' echantillon biologique avec au moins un polypeptide comprenant 
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au moins un fragment d*une proteine, ladite proteine etant choisie parmi les proteines 
dont la sequence peptidique a Tetat natif correspond a SEQ ID N*' 1, SEQ ID N° 2, 
SEQ ID N° 3, SEQ ID N° 4, SEQ ID N° 5 SEQ ID N° 6. SEQ ID N° 7, SEQ ID N° 8, 
SEQ ID N<» 10, SEQ ID NM 1, SEQ ID N*' 12, SEQ ID 13, SEQ ID N° 14, SEQ ID 
N° 15, SEQ ID N** 16, SEQ ID N° 17, SEQ ID 18, SEQ ID N*^ 19, SEQ ID N'^ 20, 
SEQ ID N° 21, SEQ ID N° 22, SEQ ID N° 23, SEQ ID N° 24, SEQ ID N° 25, SEQ ID 
N« 26, SEQ ED N« 27, SEQ IDN^ 28 et SEQ ID N° 29, les sequences peptidiques qui 
presentent au moins 70 % d'identite, de preference au moins 80 % d'identite et 
avantageusement au moins 98 % d'identite avec Tune quelconque des sequences 
peptidiques SEQ ID N° 1 a SEQ ID N° 8 et SEQ ID N° 10 a SEQ ID N° 29, et les 
sequences peptidiques ou les fragments desdites sequences appartenant a une meme 
famille de proteines choisie parmi le perlecan, le precurseur de la proteine plasmatique 
de liaison au retinol, du precurseur de Tactivateur du ganglioside GM2, de ia 
calgranuline B et de la saposine B, puis on detecte la formation d'un complexe entre 
ledit polypeptide et ledit ligand. 

17. Precede selon la revendication 16, caracterise en ce que le ligand est un 
anticorps, un recepteur, un substrat d'activite enzymatique ou une enzyme dont ledit 
polypeptide est un cofacteur. 

18. Procede selon Tune quelconque des revendications 14 a 17, caracterise 
en ce que la sequence dudit polypeptide comprend une sequence peptidique choisie 
parmi Tune quelconque des SEQ ID N° 1 a 8 et SEQ ID N° 10a 29. 

19. Procede selon Tune quelconque des revendications 14 a 17, caracterise 
en ce que la sequence dudit polypeptide consiste en une sequence peptidique choisie 
parmi Tune quelconque des SEQ ID 1 a 8 et SEQ ID N° 1 0 a 29. 

20. Procede selon I'une quelconque des revendications 14 a 19, caracterise 
en ce que Techantillon biologique est Purine, le liquide cephalo-rachidien ou le serum. 



21. Procede selon I'une quelconque des revendications 14 a 20, caracterise 
en ce que la maladie degenerative et/ou auto-immune est la sclerose en plaques. 

22. Polypeptide caracterise en ce quMl comprend au moins un fragment 
d'une proteine dont la sequence peptidique correspond a SEQ ID N° 9, ledit fragment 
comprenant au moins une mutation par rapport a la sequence de reference SEQ ID N° 8. 

23. Pol3^eptide selon la revendication 22, caracterise en ce qu'il comprend 
au moins deux mutations par rapport a la sequence de reference SEQ ID >r 8. 

24. Polypeptide selon la revendication 22, caracterise en ce qu'il est choisi 
parmi les polypeptides qui comprennent la sequence en acides amines 
FSWDNCFEGKDPAVIR, referencee SEQ ID N° 68 et la sequence en acides amines 
YSLPKSEFAVPDLELP, referencee SEQ ID N° 69. 

25. Polypeptide selon Tune des revendications 22 a 24, caracterise en ce 
qu'il comprend une proteine dont ia sequence peptidique correspond a SEQ ID N° 9. 

26. Polypeptide selon Tune des revendications 22 a 24, caracterise en ce 
qu'il consiste en une proteine dont la sequence peptidique correspond a SEQ ID N° 9. 

27. Utilisation d'au moins un polypeptide selon Tune quelconque des 
revendications 22 a 26 pour obtenir une composition diagnostique, pronostique, 
prophylactique ou therapeutique destinee a detecter, pronostiquer, prevenir ou trailer un 
etat pathologique associe a une maladie degenerative et/ou neurologique et/ou auto- 
immune. 

28. Utilisation selon la revendication 27, caracterisee en ce que le 
polypeptide tel que defini dans Tune quelconque des revendications 22 a 26 est utilise en 
melange avec au moins un polypeptide tel que defini dans Tune quelconque des 
revendications 1 a 5. 



29. Procede pour detecter au moins un ligand associe a une maiadie 
degenerative et/ou auto-immune, dans un echantiilon biologique, caracterise en ce que 
Ton met en contact I*echantillon biologique avec au moins un polypeptide tel que defini 

5 dans Tune quelconque des revendications 22 a 26, puis on detecte ia formation d'un 
complexe entre ledit polypeptide et le ligand. 

30. Procede selon la revendication 29, caracterise en ce que Pen met en 
contact Pechantillon biologique avec un polypeptide tel que defini dans I'une quelconque 

10 des revendications 22 a 26 et avec au moins un polypeptide tel que defini dans Pune 
quelconque des revendications I a 5. 

31. Procede selon la revendication 29 ou 30, caracterise en ce que ledit 
ligand est un anticorps, un recepteur, un substrat d'activite enzymatique ou une enzyme 

15 dont ledit polypeptide est un cofacteur. 

32. Procede pour detecter au moins un polypeptide tel que defini dans l*une 
quelconque des revendications 22 a 26 dans un echantiilon biologique caracterise en ce 
que I 'on met en contact 1' echantiilon biologique avec au moins un ligand specifique 

20 dudit polypeptide, puis on detecte la formation d'un complexe entre ledit polypeptide et 
ledit ligand. 

33. Procede selon la revendication 32, caracterise en ce que ledit ligand est 
anticorps monoclonal, un anticorps polyclonal, un recepteur, un substrat d'activite 

25 enzymatique ou une enzyme dont ledit polypeptide est un cofacteur. 

34. Procede selon la revendication 32 ou 33, caracterise en ce que I'on met 
en contact Pechantillon biologique avec un ligand tel que defmi dans Tune quelconque 
des revendications 31 et 33 et au moins un ligand specifique d*au moins un polypeptide 

30 tel que defini dans Tune quelconque des revendications I a 5, puis on detecte la 
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formation de complexes entre lesdits polypeptides et lesdits ligands specifiques desdits 
polypeptides. 

35. Precede selon la revendication 34, caracterise en ce que le ligand est un 
anticorps monoclonal, un anti corps polyclonal, un recepteur, un substrat d'activite 
enzymatique ou une enzyme dont ledit polypeptide est un cofacteur. 

36. Fragment nucleotidique caracterise en ce qu'il code pour un 
polypeptide tel que defini dans Tune quelconque des revendications 22 a 26. 

37. Utilisation d*un fragment nucleotidique pour obtenir une composiiioii 
diagnostique, pronostique, prophylactique ou therapeutique destinee a detecter, 
pronostiquer, prevenir ou trailer un etat pathologique associe a une maladie 
degenerative et/ou auto-immune, selon laquelle ledit fragment nucleotidique est le 
fragment nucleotidique defmi dans la revendication 36, eventuellement en association 
avec au moins un fragment nucleotidique tel que defmi dans Tune quelconque des 
revendications 8 a 11, et les fragments complementaires desdits fragments. 

38. Procede selon I'une quelconque des revendications 29 a 35, caracterise 
en ce que rechantillon biologique est Purine, le liquide cephalo-rachidien ou le serum. 



39. Procede selon Tune quelconque des revendications 29 a 35 caracterise 
en ce que la maladie degenerative et/ou auto-immune est la sclerose en plaques. 

40. Procede pour detecter au moins un polypeptide tel que defmi dans Tune 
quelconque des revendications I a 5 ou dans Tune quelconque des revendications 22 a 
26, selon lequei on preleve un echantillon d*un fluide biologique d*un patient presentant 
un etat pathologique associe a une maladie degenerative et/ou neurologique et/ou auto- 
immune et eventuellement apres purification dudit echantiilon de fluide biologique, on 
analyse par spectrometrie de masse le profil de masse obtenu a partir du fluide 
biologique et on compare a un profil de masse de reference. 
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41. Utilisation d'au moins un polypeptide comprenant au moins un 
fragment d'une proteine pour tester Tefficacite d'un agent therapeutique, ladite proteine 
etant choisie parmi les proteines dont la sequence peptidique a I'etat natif correspond a 
SEQ ID N** 1, SEQ ID N° 2, SEQ ID 3, SEQ ID N° 4, SEQ ID N° 5, SEQ ID N° 6, 
SEQ ID N° 7, SEQ ID N° 8, SEQ ID 9, SEQ ID N° 10, SEQ ID N° 11, SEQ ID N° 
12, SEQ ID N° 13, SEQ ID 14, SEQ ID N° 15, SEQ ID N° 16, SEQ ID 17, 
SEQ ID N° 18, SEQ ID N° 19, SEQ ID N° 20, SEQ ID N*^ 21, SEQ ID N° 22, SEQ ID 
N° 23, SEQ ID N° 24, SEQ ID 25, SEQ ID N° 26, SEQ ID N° 27, SEQ ID N° 28 et 
SEQ ID N° 29, les sequences peptidiques qui presentent au moins 70 % d'identite de 
preference au moins 80 % d'identite et avantageusement au moins 98 d'identite avec 
Tune queiconque des sequences peptidiques SEQ ID N° 1 a 29, et les sequences 
peptidiques ou les fragments desdites sequences appartenant a une meme famille de 
proteines choisie parmi le perlecan, le precurseur de la proteine plasmatique de liaison au 
retinol, du precurseur de Tactivateur du ganglioside GM2, de la calgranuiine B et de la 
saposine B. 

42. Utilisation d'au moins un polypeptide comprenant au moins un 
fragment d'une proteine pour la preparation d'une composition pharmaceutique destinee 
au traitement d'une maladie degenerative et/ou neurologique et/ou auto-immune, telle 
que la sclerose en plaques, ladite proteine etant choisie parmi les proteines dont la 
sequence peptidique a I'etat natif correspond a SEQ ID N** 1, SEQ ID N** 2, SEQ ID N° 
3, SEQ ID N° 4, SEQ ID N° 5, SEQ ID N° 6, SEQ ID 7, SEQ ID N° 8, SEQ ID N° 
9. SEQ ID N° 10, SEQ ID N° 1 1, SEQ ID N° 12, SEQ ID N° 13, SEQ ID N° 14, SEQ 
ID N° 15, SEQ ID N° 16, SEQ ID N° 17, SEQ ID N° 18, SEQ ID N° 19, SEQ ID N° 
20, SEQ ID N° 21, SEQ ID 22, SEQ ID N*' 23, SEQ ID N° 24, SEQ ID N** 25, 
SEQ ID N** 26, SEQ ID 27, SEQ ID N° 28 et SEQ ID N*» 29, les sequences 
peptidiques qui presentent au moins 70 % d'identite de preference au moins 80 % 
d'identite et avantageusement au moins 98 d'identite avec I'une queiconque des 
sequences peptidiques SEQ ID N° I a 29, et les sequences peptidiques ou les fragments 
desdites sequences appartenant a une meme famille de proteines choisie parmi le 



perlacan, le precurseur de !a proteine plasmatique de liaison au retinol, du precurseur de 
I'activateur du ganglioside GM2, de la calgranuline et de la saposine. 

43. Utilisation selon la revendication 41 ou 42, caracterisee en ce que le 
polypeptide est choisi parmi SEQ ID N** 2, 4,8, 9, 17, 24. 

44. Utilisation d'au moins un fragment nucleotidique, pour tester 
Tefficacite d*un agent therapeutique pour un etat pathologique associe a une maladie 
degenerative et/ou neurologique et/ou auto-immune, selon laquelle ledit fragment 
nucleotidique est choisi parmi les fragments qui cedent pour au moins un fragment 
d'une proteine, ladite proteine etant choisie parmi les proteines dont la sequence 
peptidique a I'etat natif correspond a SEQ ID N** 1, SEQ ID N° 2, SEQ ID N** 3, SEQ 
ID N° 4, SEQ ID N° 5. SEQ ID N° 6. SEQ ID N° 7, SEQ ID N° 8, SEQ IDN** 9, SEQ 
ID N° 10, SEQ ID N° 1 1, SEQ ID N° 12, SEQ ID N° 13, SEQ ID N<» 14, SEQ ID N<> 
15, SEQ ID N° 16, SEQ ID N° 17, SEQ ID N** 18, SEQ ID N° 19. SEQ ID N° 20, 
SEQ ID N** 2 1, SEQ ID N° 22, SEQ ID N° 23, SEQ ID N** 24, SEQ ID N° 25, SEQ ID 
N*' 26, SEQ ID N° 27, SEQ ID N° 28 et SEQ ID N° 29, les sequences peptidiques qui 
presentent au moins 70 % d'identite, de preference au moins 80 % et avantageusement 
au moins 98 % d'identite avec Tune quelconque des sequences peptidiques SEQ ID N° 
I a 29, et les fragments complementaires desdits fragments et les fragments qui cedent 
pour les sequences peptidiques ou les fragments desdites sequences appartenant a une 
meme famille de proteines choisie parmi le perlecan, le precurseur de la proteine 
plasmatique de liaison au retinol, du precurseur de I'activateur du ganglioside GM2, de 
la calgranuline B et de la saposine B. 

45. Utilisation pour tester Tefficacite d'un agent therapeutique pour un 
etat pathologique associe a une maladie degenerative et/ou neurologique et/ou auto- 
immune, de proteines recombinantes et/ou codees par tout ou partie des fragments 
nucleotidiques defmis a la revendication 44. 
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46. Utilisation d'au moins un fragment nucleotidique pour la preparation 
d'une composition pharmaceutique destinee au traitement d'une maladie degenerative 
et/ou neurologique et/ou auto-immune, telle que la sclerose en plaques, selon laquelle 
ledit fragment nucleotidique est choisi parmi des fragments qui codent pour au moins un 
5 fragment d'une proteine, ladite proteine etant choisie parmi les proteines dent la 
sequence peptidique a I'etat natif correspond a SEQ ID N° 1, SEQ ID N° 2, SEQ ID N** 
3. SEQ ID N° 4, SEQ ID N° 5, SEQ ID N° 6. SEQ ID N° 7. SEQ ID N° 8, SEQ IDN° 
9, SEQ ID N° 10. SEQ ID NM 1, SEQ ID N° 12, SEQ ID N° 13, SEQ ID N° 14, SEQ 
ID N° 15, SEQ ID 16, SEQ ID N° 17, SEQ ID N° 18. SEQ ID 19, SEQ ID N° 

10 20, SEQ ID N° 21, SEQ ID N° 22, SEQ ID N° 23, SEQ ID N° 24, SEQ ID N° 25, 
SEQ ID N° 26, SEQ ID N° 27. SEQ ID N° 28 et SEQ ID N° 29, les sequences 
peptidiques qui presentent au moins 70 % d'identite, de preference au moins 80 % et 
avantageusement au moins 98 % d'identite avec I'une quelconque des sequences 
peptidiques SEQ ID N** 1 a 29, et les fragments complementaires desdits fragments et 

15 les fragments qui codent pour les sequences peptidiques ou les fragments desdites 
sequences appartenant a une meme famille de proteines choisie parmi le perlecan, le 
precurseur de la proteine plasmatique de liaison au retinol, du precurseur de Tactivateur 
du ganglioside GM2, de la calgranuline B et de la saposine B. 

20 47. Utilisation pour la preparation d'une composition pharmaceutique 

destinee au traitement d'une maladie degenerative et/ou neurologique et/ou auto- 
immune, telle que la sclerose en plaques, de proteines recombinantes et/ou codecs par 
tout ou partie des fragments nucleotidiques definis a la revendication 46. 

25 48. Utilisation selon la revendication 44 ou 46, caracierisee en ce que ledit 

fragment nucleotidique code pour ladite proteine. 



49. Utilisation selon la revendication 48, caracterisee en ce que la sequence 
peptidique de ladite proteine a I'etat natif consiste en une sequence choisie parmi i'une 
30 quelconque des SEQ ID 1 a 29, les sequences peptidiques qui presentent au moins 
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70 % d'identite de preference au moins 80 % d'identite et avantageusement au moins 98 
d'identite avec I'une quelconque des sequences peptidiques SEQ ID N° 1 a 29, et les 
sequences peptidiques ou les fragments desdites sequences appartenant a une meme 
famille de proteines choisies parmi le perlecan, le precurseur de la proteine plasmatique 
de liaison au retinol, du precurseur de Tactivateur du ganglioside GM2, de la 
caigranuline B et de la saposine B. 

50. Utilisation selon la revendication 49, caracterisee en ce que les 
polypeptides sont choisis parmi SEQ ID N° 2, 4, 8, 9, 17, 24. 

51. Utilisation d'au rnoiris un fragnienl iiucleotidique, pour tester 
TefFicacite d'un agent therapeutique pour un etat pathologique associe a une maladie 
degenerative et/ou neurologique et/ou auto-immune selon laquelle ledit fragment est un 
fragment d'une sequence nucleique choisie parmi Tune quelconque des SEQ ID N° 30, 
SEQ ID N° 31, SEQ ID 32, SEQ ID N° 33, SEQ ID N° 34, SEQ ID N° 35, SEQ ID 
N° 36, SEQ ID N° 37, SEQ ID N*^ 38, SEQ ID N° 39, SEQ ID N° 40, SEQ ID N*> 41, 
SEQ ED N° 42, SEQ ID N° 43, SEQ ID N° 44, SEQ ID N° 45, SEQ ID N*^ 46 et SEQ 
ID N° 47, SEQ ID N° 48, SEQ ID N° 49 et SEQ ID N° 50, SEQ ID N° 5 1, SEQ ID N° 
52, SEQ ID N° 53, SEQ ID N° 54, SEQ ID N° 55, SEQ ID 56, SEQ ID N° 57, 
SEQ ID N° 66, SEQ ID N° 67, SEQ ID N*^ 68, SEQ ID N° 69, SEQ ID N^70 , SEQ ID 
N° 71, et leurs sequences complementaires. 

52. Utilisation d'au moins un fragment nucleotidique pour ia preparation 
d'une composition pharmaceutique destinee au traitement d'une maladie degenerative 
et/ou neurologique et/ou auto-immune, telle que la sclerose en plaques selon laquelle 
ledit fragment est un fragment d'une sequence nucleique choisie parmi Tune quelconque 
des SEQ ID N° 30, SEQ ID N° 31, SEQ ID N° 32, SEQ ID N° 33, SEQ ID N° 34, 
SEQ ID N° 35, SEQ ID N° 36, SEQ ID N° 37, SEQ ID N° 38, SEQ ID N° 39, SEQ ID 
N'* 40, SEQ ID N° 41, SEQ ID 42, SEQ ID N° 43, SEQ ID N** 44, SEQ ID N° 45, 
SEQ ID N** 46 et SEQ ID N° 47, SEQ ID N° 48, SEQ ID N° 49 et SEQ ID 50, SEQ 
ID N** 51, SEQ ID N<» 52. SEQ ID N*' 53, SEQ ID N° 54, SEQ ID 55, SEQ ID N° 
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56, SEQ ID N** 57, SEQ ID N° 66, SEQ ID N°67. SEQ ID N° 68, SEQ ID N° 69, SEQ 
ID N°70 , SEQ ID N° 71, et leurs sequences complementaires. 

53. Utilisation selon la revendication 51 ou 52, caracterisee en ce que la 
sequence nucleique est choisie parmi SEQ ID N'' 30, 3 1, 42, 53. 

54. Utilisation de la lycorine pour la preparation d'une composition pour la 
prevention et/ou le traitement de maladie degenerative ei/ou neurologique et/ou auto- 
immune. 
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avec la SEQ ID N° 8 du precurseur de I'activateur du ganglioside GM2 et le fragment 
de SEQ ID N** 9 qui commence a Pacide amine 34 et se termine a Tacide amine 202 
presente 98,88 % d'homologie ou d'identite avec le fragment correspondant de la 
proteine native identifiee en SEQ ID N° 8. 

5 

Exemple 10 : Mise en evidence des proteines dans un echantilion urinaire. 
Des echantillons d'urine provenant d'un individu SEP negatif et d'un 
patient SEP positif ont ete preleves. Ces echantillons d'urine ont ete purifies selon le 
protocole decrit precedemment. Les fractions d'elution fmales 21 ont ete analysees 

10 separement par spectrometrie de masse. Le profil de masse de chaque fraction 
correspondant a chaque echantilion d'urine a ete compare au profil de masse obtenu 
pour les proteines identifiees dans les exemples precedents. Les resultats montrent que 
pour Pechantillon d'urine provenant du patient SEP positif les masses correspondent 
aux molecules (i) fragment C-terminal du Perlecan, (ii) precurseur de la proteine 

15 activatrice du ganglioside GM2, (iii) calgranuline B et (iv) saposine B identifiees 
precedemment. Par contre aucune de ces masses n'a ete identifiee dans le profil de 
masse obtenu apres analyse de Pechantillon d'urine provenant de I'individu SEP negatif 
Le procede decrit est utilisable comme essai de diagnostic. 

20 Exemple 1 1 : Essai en Western Blot. 

Des Western Blot ont ete realises sur differentes fractions d'urine brute ou 
purifiee comme decrit dans Texemple 2. Des echantillons d'urine provenant d'individus 
sains et de patients atteints de sclerose en plaques sent testes en parallele. Les 
echantillons sont deposes sur un gel d'electrophorese permettant de separer les 

25 differentes proteines en fonction de leur masse moleculaire sous Paction d'un champ 
electrique. Les Western Blot sont realises apres transfert des proteines du gel sur une 
membrane. Pour reveler les proteines transferees, la membrane est saturee en tampon de 
saturation, puis incubee avec un anticorps directement marque a la phosphatase alcaline. 
L'anticorps utilise est un anticorps anti-calgranuline (anticorps monoclonal de souris, 

30 clone CF 145 sous-type IgG 2b commercialise par la societe Valbiotech : reference 
MAS 696p lot PC96G696). Le substrat de Penzyme est le dichlorure de 3,3'-(l,r- 
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biphenyI)4,4'diazonium et 2-naphtalenyl phosphate de sodium (commercialise sous la 
denomination p Naphtyl acid phosphate Sigma ref N7375 et 6 dianisine Tetrazotized 
D3502) est ajoute pour la revelation des bandes et la visualisation des proteines liees a 
Tanticorps. Une molecule de masse moleculaire apparente d'environ 14 000 est revelee 
5 dans !es urines purifiees de patients atteints de SEP, avec un signal relativement intense. 
Cette proteine correspond a la calgranuline B (masse moleculaire apparente : 14 kD). 
Par contre, aucun signal n*est observe a partir d'urine d'individus sains. Cette 
observation confirme la presence de cette proteine specifiquement dans les urines de 
patients atteints de SEP et la mise en ceuvre d'un procede de detection utilisant un 
10 anticorps reconnaissant la proteine. 

Exemple 12 : Production d 'anticorps monoclonaux. 

La production d'anticorps monoclonaux par ascite impose une 
compatibilite du systeme H-2 entre Thybridome et la souris productrice. 20 souris 

15 femelles Balb/c, agees de 6 semaines, subissent une injection de 0.5ml de Pristane (2-6- 
10-14 acide tetramethylpentadecane) dans leur cavite peritoneale, pour la production 
d'ascite (Porter et al., 1972). Une semaine a 10 jours plus tard, 5.10* a 10.10* 
hybridomes dilues dans 0.5ml de tampon sterile NaCl 0. 145M, Na2HP04 10 mM, KCL 
2.7 mM, KH2P04 1.5 mM a pH 7.4. sont injectes par voie intraperitoneale. L*ascite 

20 apparait une a deux semaines plus tard. Les liquides d 'ascites presents dans la cavite 
peritoneale sont alors recueillis avec une seringue apres incision du peritoine. Le liquide 
recueilli est centrifuge a 3000g pendant 15 minutes a temperature ambiante, filtre sur 
gaze pour eliminer le gras, puis tamponne en ajoutant 1/20"'"* de son volume de tris- 
HCL IM a pH 8.0. Cette methode permet d*obtenir des quantites d'anticorps 10 fois 

25 superieures a celles obtenues par culture d' hybridomes, 

Les immunoglobulines present es dans le liquide d*ascite sont relarguees par 
les sels (sulfate d'ammonium ou sulfate de sodium). Le liquide d 'ascite est precipite par 
le sulfate d'ammonium 40%. Apres 20 minutes au froid la solution est centrifugee 15 
minutes 8000g a 4°C. Le precipite est lave et resuspendu a froid dans une solution de 

30 sulfate d'ammonium 40% puis de nouveau centrifuge. Le nouveau precipite enrichi en 
IgG est remis en solution dans du tampon PBS et dialyse la nuit contre le tampon Tris- 
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HCl 25 mM, NaCl 150 mM pH 7.4. Parallelement une colonne d'agarose-Proteine A 
(ou proteine G) (commercial isee sour forme lyophilisee. Pierce) est lavee extensivement 
avec le tampon Tris-HCl 25 mM, NaCl ISOmM pH7.4. La solution enrichie en IgG est 
depose sur la colonne puis la colonne est lavee. Les IgG retenues par la colonne sont 
5 eludes a pH acide (glycine 200 mM pH 2.8). Les fractions dluees sont neutralisees avec 
un volume de Tris-Base IM pH 10.5. Le contenu en immunoglobulines de chaque 
fraction recueillie est quantifiee par lecture d'absorbance a 280 nm (e l%,lcm = 14.0 
Prahl et Porter 1968). Les fractions riches sont poolees. Le degre de purification des 
IgGs poolees est analyse par electrophorese en gel d'acrylamide en presence de SDS. 

10 Les IgGs purifiees sont dialysees une nuit centre le tampon Tris-HCI 25 mM, NaCJ 
150mM pH7.4, filtrees sterilement, aliquotees et conservees a -20-C. leur conceritration 
finale est determinee par lecture de Pabsorbance a 280 nm ou par dosage micro-BCA. 
Les peptides immunogenes references SEQ ID N*' 58, SEQ ID N*' 54, SEQ ID 55, 
SEQ ID N° 56. SEQ ID 57, SEQ ID N° 58, SEQ ID N** 59 etSEQ ID N** 65 ont 

15 6t6 utilises pour la production d*anticorps monoclonaux, selon le protocole decrit ci 
dessus. 

Mais, il est a la portee de Thomme du metier de definir d'autres protocoles 
pour la production d'anti corps monoclonaux, par exemple a partir des techniques 
decrites par Kohler et Milstein et par Galfre G. aL precedemment cites ou des 
20 techniques derivees de celles ci. 



Exemple 13 : Mesure de I'activite des cellules T par proliferation des 
cellules T (Sredni et ah, 1981). 

Les cellules T sont lavees deux fois en milieu de culture pour eliminer toute 

25 trace d'IL2 presente dans le milieu initial de culture. Des lymphocytes B (EBV-LCL) ou 
des monocytes/macrophages pris comme cellules presentatrices de Tantigene, sont 
irradiees a 1 0000 rads, lavees deux fois avec du milieu de culture (RPMl). 2.10* cellules 
T (2.10^ cellules /ml) et 2.10** cellules B autologues irradiees (2.10^ cellules /ml) sont 
incubees ensemble en presence d'une ganome de concentration croissante de Tantigene 

30 sous un volume final de 200 pi dans des micropuits. Apres 48 heures de culture a 37**C, 
1 \kC\ de 3H- thymidine dans 50 \x\ de milieu RPMI est ajoute dans chaque puits. Les 
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cellules T, seules a se diviser, incorporent la thymidine tritiee dans I'ADN. Apres 18 
heures de culture, les cellules de chaque micropuits sont recoltees sur des pastilles de 
laine de verre par aspiration. Apres lyse osmotique des cellules, la radioactivite 
incorporee dans I'ADN est absorbee sur les pastilles (ceil Harvester 530, Inotech). 
Chaque pastille sechee est placee dans un tube plastique qui contient 2 ml de scintillant ; 
la radioactivite b adsorbee sur chacune des pastilles est quantifiee dans un compteur beta 
a scientillation liquide (LKB Rackbeta 1217). Les resultats sont exprimes comnne 
moyenne arithmetique de cpm /culture ('coups par minute')- 

Exemple 14 : Protocole de detection de rassociation entre les peptides et 
les molecules d'histocompatibilite (approche APC transformees avec un peptide se 
fixant au CMH I). 

1 ) Materiel; 

Les sources de molecules d'histocompatibilite sont actuellemem de deux 
types principaux : les cellules mutantes et les molecules d'histocompatibilite purifiees. 

La cellule mutante utilisee est la cellule humaine T2 qui et un variant de la 
lignee Tl produite par fusion du lymphome T CEM et du lymphome B 721.174 (Salter 
and Cressw^ell Embo J 1986, 5: 943-949). Cette cellule qui est depourvue de 
transporteurs de peptides contient des chaines lourdes de molecules de classe I libres de 
peptides qui vont pouvoir accepter de peptides exogenes. 

Des molecules d*histocompatibiIite de classe I purifiees par 
chromatographic d'affinite a partir de lignees de cellules B humaines transformees par 
I'EBV peuvent etre egalement utilisees. Dans ce cas les peptides endogenes doivent etre 
elimines par un traitement avec de Tureel S M et de la soude 12.5 mM (pH 11.7) 
pendant 1 heure a 4'*C,suivi de ieur elimination par une colonne de desalage (PDLO, 
Pharmacia). Les molecules d'histocompatibilite sont immediatement remises en presence 
des peptides a tester dans un tampon PBS avec 0.05% Tween 20, 2 mM EDTA, 0. 1% 
NP40 et6mM CHAPS, en presence de 2fig/ml B2m pour faciliter la reassociation 
(Gnjatic et al., Eur J Immunol 1995 25 : 1638-1642). 
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Les peptides testes ont en general 8 a 10 residus, parfois 11 ou 12. lis ont 
6te synthetises par Neosystems (Strasbourg), ou par Chiron mimotopes (Victoria, 
Australie). lis sont utilises a des concentrations variant de 100 )iM aO.l nM. 

2) Protocole de !*assemblage (Connan et a!., Eur J Immunol 1994, 24 : 
5 777 ; Couillin et al. Eur J Immunol 1995, 25 : 728-732). 

Des aliquotes de 8 J 05 cellules dans un volume de 64 ^1, repartis dans des 
tubes microfuge Eppendorf, sont mis en presence d'un tampon de lyse contenant 10 mM 
PBS, pH 7.5 1% NP40, des inhibiteurs de proteases (! mM PMSF, 100 pM 
iodoacetamide, 2 pg /ml aprotinine, 10 leupeptine, 10 pM pepstatine et 10 pg/ml 

10 inhibiteur de trypsine). La lyse se fait en presence des peptides a tester pendant 30 
minutes ou 1 heure a 37°C. Apres elimination du materiel non solubilise par une 
centrifligation a 15 000 tours /minute a 4°C, le surnageant et additionne de 140 ^l de 
PBS contenant 0.05% de Tween 20, 3 mM d'azide de sodium, 1 nriM PMSF et 10 
mg /ml d'albumine bovine. Chaque echantillon est incube pendant 20 heures a 4**C dans 

15 2 puits d'une plaque a microtitration de type Nunc,Maxisorb, prealablement recouverts 
d'un anticorps monoclonal (10 pg /ml en PBS) qui reconnait les molecules 
d'histocompatibilite ayant une(des) conformation(s) conforme(s) pour la presentation de 
peptides et semblable(s) a celie(s) presente(s) a la surface des cellules. La plaque 
recouverte d'anticorps est prealablement saturee par de I'albumine bovine a 10 mg /ml 

20 dans du PBS-Tween avant la mise de I'echantillon. Le second anticorps qui permet la 
detection de Tassemblage des molecules d'histocompatibilite est dirige contre la B2m. II 
est couple soit a la biotine (NHS-LC biotin, Pierce) soit a la phsophatase alcaline (P- 
552, Sigma) et est incube a 2 pg /ml pendant une heure a 37°C. Dans le cas de Temploi 
de la biotine, une incubation de 45 minutes a 20-25°C avec de la streptavidine couplee a 

25 la phosphatase alcaline (E-2636, Sigma) est realisee. L'activite de la phosphatase 
alcaline est mesuree en utilisant comme substrat le 4-methyl-umbelliferyl-phosphate (M- 
8883, Sigma) a 100 pM dans de la diethanolamine 50 mM, pH 9.5 avec du MgC12 1 
mM. La lecture est faite a 340/460 nm a Taide d'un cytofluori metre. 

3) Stabilite des complexes FTLA/peptides : 

30 La stabilite des complexes precites a ete etudiee car elle conditionne la 

bonne presentation de Tantigene et Tinduction de la reponse T. A cet effet, on a utilise 
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soit du HLA purifie, soil le lysat de la cellule T2. Avec le HLA purifie, on a elimine les 
peptides endogenes (comme decrit en 2)) puis on I'a mis en presence du peptide a tester 
en tube Eppendorf a 37°C, pendant des temps variables de quelques minutes a plusieurs 
jours. La phase suivante d 'incubation sur plaque de 96 puits (comme decrit en 2) avec 
5 Tanticorps anti-HLA se fait pendant une heure a 37°C. La revelation est effectuee de 
mani^re classique. Avec le lysat de la cellule T2, toutes les incubations sont egalement 
faites a 37°C, apres ajout de tous les inhibiteurs de proteases. 

Exemple 15 : Technique d'immunohistologie. 

10 Les coupes histologique preparees en paraffme sont deparaffmees en xylene 

et alcool avant de subir un pretraitement qui a pour but de demasquer les antigenes ; ce 
pretraitement peut correspondre a (i) deux fois 5 minutes sous micro-onde (750W) en 
presence d'un tampon citrate de sodium, acide citrique, (ii) un traitement a Tacide par 
incubation 15 minutes dans une solution d'acide petiodique 1% ou par incubation 5 

15 minutes dans une solution d' acide formique 99%. Les peroxydases endogenes sont 
ensuite bloquees par incubation des lames 30 minutes en eau oxygenee 1% puis lavage 
extensif en eau pendant 15 minutes. Le bruit de fond est bloque en incubant les lames 30 
minutes en presence de PBS Triton 0.03%, 10% serum Donkey (pour les anticorps 
polyclonaux) ou 10% serum Goat (pour les anticorps monoclonaux). Un marquage avec 

20 Tanticorps primaire est realise en appliquant 100 a 200 ^l de solution d' anticorps 
primaire par lame (0.5 a 5 pg /ml selon le titre) dans du PBS Triton 0.03% puis en 
incubant 2 heures a temperature ambiante. Les lames sont ensuite rincees 3 fois en PBS- 
Triton pendant 10 minutes. Un marquage anticorps secondaire est realise en utilisant des 
anticorps biotinyles capables de se fixer specifiquement aux anticorps primaires, par 

25 exemples des anti-IgG de lapin ou anti-IgG de souris dilues dans du PBS-Triton 0.03%. 
les lames sont lavees et incubees dans une solution pendant 2 heures (2 ^l complexe 
streptavidine-biotine-peroxides, 1600 pi PBS-Triton 0.03%). Les lames sont de nouveau 
lavees avant d'etre revelees a Tabri de la lumiere dans le tampon A puis rincees a Teau 
avant observation microscopique. Tampon A pour 5 lames : 25 ml TrisO.OSM pH 7.6, 

30 2.5 ml Imidazole IM, 15 ml eau sterile. 2 ml DAB 5 mg /ml, 5 mlNickel d'ammonium 
10%, 30 pi H202 1%. 
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LISTE DE SEQUENCES 



SEQ ID N° 1 : sequence complete du Perlacan:>gi|I730508|sp|P98l601PGBM_HUMAN BASEMENT 
MEMBRANE-SPECIFIC HEPARAN SULFATE 

PROTEOGLYCAN CORE PROTEIN PRECURSOR (HSPG) (PERLECAN) (PLC) 

MGWRAPGALLLALLLHGRLLAVTHGLRAYDGLSLPEDIETVTASQMRWTHSYLSDDEDMLADS 

ISGDDLGSGDLGSGDFQMVYFRALVNFTRSIEYSPQLEDAGSREFREVSEAWDTLESEYLKIPG 

DQWSWFIKELDGWVFVELDVGSEGNADGAQIQEMLLRVISSGSVASYVTSPQGFQFRRLGTV 

PQFPRACTEAEFACHSYNECVALEYRCDRRPDCRDMSDELNCEEPVLGISPTFSLLVETTSLPPRP 

ETTIMRQPPVTHAPQPLLPGSVRPLPCGPQEAACRNGHCIPRDYLCDGQEDCEDGSDELDCGPPP 

PCEPNEFPCGNGHCALKLWRCDGDFDCEDRTDEANCPTKRPEEVCGPTQFRCVSTNMCIPASFH 

CDEESDCPDRSDEFGCMPPQWTPPRESIQASRGQTVTFTCVAIGVPAPFLINWRLNWGHIPSQPR 

VTVTSEGGRGTLIIRDVKESDQGAYTCEAMNARGMVFGIPDGVLELVPQRAGPCPDGHFYLEHS 

AACLPCFCFGITSVCQSTRRFRDQIRLRFDQPDDFKGVNVTMPAQPGTPPLSSTQLQIDPSLHEFQ 

LVDLSRRFLVHDSFWALPEQFLGNKVDSYGGSLRYNVRYELARGMLEPVQRPDWLVGAGYRL 

LSRGHTPTQPGALNQRQVQFSEEHWVHESGRPVQRAELLQVLQSLEAVLIQTVYNTKMASVGLS 

DIAMDTTVTHATSHGRAHSVEECRCPIGYSGLSCESCDAHFTRVPGGPYLGTCSGCSCNGHASSC 

DPVYGHCLNCQHNTEGPQCKKCKAGFFGDAMKATATSCRPCPCPYIDASRRFSDTCFLDTDGQ 

ATCDACAPGYTGRRCESCAPGYEGNPIQPGGKCRPVNQE1VRCDERGSMGTSGEACRCKNNW 

GRLCNECADRSFHLSTRNPDGCLKCFCMGVSRHCTSSSWSRAQLHGASEEPGHFSLTNAASTHT 

TNEGIFSPTPGELGFSSFHRLLSGPYFWSLPSRFLGDKVTSYGGELRFTVTQRSQPGSTPLHGQPLV 

VLQGNNIILEHHVAQEPSPGQPSTFIVPFREQAWQRPDGQPATREHLLMALAGIDTLLIRASYAQ 

QPAESRVSGISMDVAVPEETGQDPALEVEQCSCPPGYRGPSCQDCDTGYTRTPSGLYLGTCERCS 

CHGHSEACEPETGACQGCQHHTEGPRCEQCQPGYYGDAQRGTPQDCQLCPCYGDPAAGQAAH 

TCFLDTDGHPTCDACSPGHSGRHCERCAPGYYGNPSQGQPCQRDSQVPGPIGCNCDPQGSVSSQ 

CDAAGQCQCKAQVEGLTCSHCRPHHFHLSASNPDGCLPCFCMGITQQCASSAYTRHLISTHFAP 

GDFQGFALVNPQRNSRLTGEFTVEPVPEGAQLSFGNFAQLGHESFYWQLPETYQGDKVAAYGG 

KLRYTLSYTAGPQGSPLSDPDVQITGNNIMLVASQPALQGPERRSYEIMFREEFWRRPDGQPATR 

EHLLMALADLDELLIRATFSSVPLVASISAVSLEVAQPGPSNRPRALEVEECRCPPGYIGLSCQDC 

APGYTRTGSGLYLGHCELCECNGHSDLCHPETGACSQCQHNAAGEFCELCAPGYYGDATAGTP 

EDCQPCACPLTNPENMFSRTCESLGAGGYRCTACEPGYTGQYCEQCGPGYVGNPSVQGGQCLP 

ETNQAPLWEVHPARSIVPQGGSHSLRCQVSGRGPHYFYWSREDGRPVPSGTQQRHQGSELHFPS 

VQPSDAGVYICTCRNLHRSNTSRAELLVTEAPSKPITVTVEEQRSQSVRPGADVTFICTAKSKSPA 

YTLWTRLHNGIO-PTRAMDFNGTLTIRNVQLSDAGTYVCTGSNMFAMDQGTATLHVQASGTLS 

APWSIHPPQLTVQPGQLAEFRCSATGSPTPTLEWTGGPGGQLPAKAQIHGGILRLPAVEPTDQA 

QYLCRAHSSAGQQVARAVLHVHGGGGPRVQVSPERTQVHAGRTVRLYCRAAGVPSATITWRK 

EGGSLPPQARSERTDIATLLIPAITTADAGFYLCVATSPAGTAQARIQVWLSASDASQPPVKIESS 

SPSVTEGQTLDLNCWAGSAHAQVTWYRRGGSLPHHTQVHGSRLRLPQVSPADSGEYVCRVEN 

GSGPKEASITVSVLHGTHSGPSYTPVPGSTRPIRIEPSSSHVAEGQTLDLNCWPGQAHAQVTWH 

KRGGSLPARHQTHGSLLRLHQVTPADSGEYVCHWGTSGPLEASVLVTIEASVIPGPIPPVRIESSS 

STVAEGQTLDLSCWAGQAHAQVTWYKRGGSLPARHQVRGSRLYIFQASPADAGQYVCRASN 

GMEASITVTVTGTQGANLAYPAGSTQPIRIEPSSSQVAEGQTLDLNCWPGQSHAQVTWHKRGG 

SLPVRHQTHGSLLRLYQASPADSGEYVCRVLGSSVPLEASVLVTIEPAGSVPALGVTPTVRIESSS 

SQVAEGQTLDLNCLVAGQAHAQVTWHKRGGSLPARHQVHGSRLRLLQVTPADSGEYVCRWG 

SSGTQEASVLVTIQQRLSGSHSQGVAYPVRIESSSASLANGHTLDLNCLVASQAPHTITWYKRGG 

SLPSRHQIVGSRLRIPQVTPADSGEYVCHVSNGAGSRETSLIVTIQGSGSSHVPRVSPPIRIESSSPT 

WEGQTLDLNCWARQPQAIITWYKRGGSLPSRHQTHGSHLRLHQMSVADSGEYVCRANNNID 

ALEASIVISVSPSAGSPSAPGSSMPIRIESSSSHVAEGETLDLNCWPGQAHAQVTWHKRGGSLPS 

YHQTRGSRLRLHHVSPADSGEYVCRVMGSSGPLEASVLVTIEASGSSAVHVPAPGGAPPIRIEPSS 

SRVAEGQTLDLKCWPGQAHAQVTWHKRGGNLPARHQVHGPLLRLNQVSPADSGEYSCQVTG 

SSGTLEASVLVTIEPSSPGPIPAPGLAQPIYIEASSSHVTEGQTLDLNCWPGQAHAQVTWYKRGG 

SLPARHQTHGSQLRLHHVSPADSGEYVCRAAGGPGPEQEASFTVTVPPSEGSSYRLRSPVISIDPP 

SSTVQQGQDASFKCLIHDGAAPISLEWKTRNQELEDNVHISPNGSIITIVGTRPSNHGTYRCVASN 

AYGVAQSWNLSVHGPPTVSVLPEGPVWVKVGKAVTLECVSAGEPRSSARWTRISSTPAKLEQR 
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TYGLMDSHTVLQISSAKPSDAGTYVCLAQNALGTAQKQVEVTVDTGAMAPGAPQVQAEEAELT 
VEAGHTATLRCSATGSPARTIHWSKLRSPLPWQHRLEGDTLIIPRVAQQDSGQYICNATSPAGHA 
EATIILHVESPPYATTVPEHASVQAGETVQLQCLAHGTPPLTFQWSRVGSSLPGRATARNELLHF 
ERAAPEDSGRYRCRVTNKVGSAEAFAQLLVQGPPGSLPATSIPAGSTPTVQVTPQLETKSIGASV 
5 EFHCAVPSDRGTQLRWFKEGGQLPPGHSVQDGVLRIQNLDQSCQGTYICQAHGPWGKAQASAQ 
LVIQALPSVLTNIRTSVQTVVVGHAVEFECLALGDPKPQVTWSKVGGHLRPGIVQSGGVVRIAHV 
ELADAGQYRCTATNAAGTTQSHVLLLVQALPQISMPQEVRVPAGSAAVFPCIASGYPTPDISWS 
K1-DGSLPPDSRLE>WMLMLPSVQPQDAGTYVCTATNRQGKVKAFAHLQVPER\^YFTQ^ 
FLPLPTIKDAYRKFEIKITFRPDSADGMLLYNGQKRVPGSPTNTLANRQPDFISFGLVGGRPEFRFD 

10 AGSGMATIRHPTPLALGHFHTVTLLRSLTQGSLIVGDLAPVNGTSQGJCFQGLDLNEELYLGGYPD 
YGAIPKAGLSSGFIGCVRELRIQGEEIVFHDLNLTAHGISHCPTCRDRPCQNGGQCHDSESSSYVC 
VCPAGFTGSRCEHSQALHCHPEACGPDATCVNRPDGRGYTCRCHLGRSGLRCEEGVTVTTPSLS 
GAGSYLALPALTNTHHELRLDVEFKPLAPDGVLLFSGGKSGPVEDFVSLAMVGGHLEFRYELGS 
GLAVLRTAEPLALGRWHRVSAERLNKDGSLRVNGGRPVLRSSPGKSQGLNLHTLLYLGGVEPSV 

15 PLSPATNMSAHFRGCVGEVSVNGKRLDLTYSFLGSQGIGQCYDSSPCERQPCQHGATCMPAGEY 
EFQCLCRDGIKGDLCEHEENPCQLREPCLHGGTCQGTRCLCLPGFSGPRCQQGSGHGIAESDWH 
LEGSGGNDAPGQYGAYFHDDGFLAFPGHVFSRSLPEVPETIELEVRTSTASGLLLWQGVEVGEA 
GQGKDFISLGLQDGHLVFRYQLGSGEARLVSEDPINDGEWHRVTALREGRRGSIQVDGEELVSG 
RSPGPNVAVNAKGSIYIGGAPDVATLTGGRFSSGITGCVKNLVLHSARPGAPPPQPLDLQHRAQA 

20 GANTRPCPS 

SEQ ID N*2 

DAPGQYGAYF HDDGFLAFPG HVFSRSLPEV PETIELEVRT STASGLLLWQ GVEVGEAGQG 60 
KDFISLGLQD GHLVFRYQLG SGEARLVSED PINDGEWHRV TALREGRRGS IQVDGEELVS 120 
25 GRSPGPNVAV NAKGSVYIGG APDVATLTGG RFSSGITGCV KNLVLHSARP GAPPPQPLDL 180 
QHRAQAGANT RPCPS 

SEQ ID N° 3 >gi|503 I773|rcf|NP_005520. l!pHSPG2} heparan sulfaie proteoglycan 2 (pcrlecan); 
HSPG - un fragment -de la sequence du Pcrleacan SEQ IN N° 3 

30 RTCRCKNNWGRLCNECADRSFHLSTRNPDGCLKCFCMGVSRHCTSSSWSRAQLHGASEEPGHF 
SLTNAASTHTTNEGIFSPTPGELGFSSFHRLLSGPYFWSLPSRFLGDKVTSYGGELRFTVTQRSQP 
GSTPLHGQPLWLQGNNIILEHHVAQEPSPGQPSTFIVPFREQAWQRPDGQPATREHLLMALAGI 
DTLLIRASYAQQPAESRLSGISMDVAVPEETGQDPALEVEQCSCPPGYLGPSCQDCDTGYTRTPS 
GLYLGTCERCSCHGHSEACEPETGACQGCQHHTEGPRCEQCQPGYYGDAQRGTPQDCQLCPCY 

35 GDPAAGQAALTCFLDTDGHPTCDACSPGHSGRHCERCAPGYYGNPSQGQPCQRDSQVPGPIGC 
NCDPQGSVSSQCDAAGQCQCKAQVEGLTCSHCRPHHFHLSASNPDGCLPCFCMGITQQCASSAY 
TRJHLISTHFAPGDFQGFALWPQRNSRLTGEFTX^PWEGAQLSFGNFAQLGHESFYW 

SEQ ID N''4 

40 MKWVWALLLL AAWAAAERDC RVSSFRVKEN FDKARFSGTW YAMAKKDPEG LFLQDNIVAE 60 
FSVDETGQMS ATAKGRVRLL NNWDVCADMV GTFTDTEDPA KFKMKYWGVA SFLQKGNDDH 120 
WIVDTDYDTY AVQYSCRLLN LDGTCADSYS FVFSRDPNGL PPEAQKIVRQ RQEELCLARQ 180 
YRLIVHNGYC DGRSERNLL 

45 SEQ ID N** 5 >gi[132404|spIP02753|RETB_HUMAN PLASMA RETINOL-BINDING PROTEIN 
PRECURSOR (PRBP) 
(RBP) 

MKWWALLLLAAWAAAERDCRVSSFRVKENFDKARFSGTWYAMAKKDPEGLFLQDNIVAEFS 
VDETGQMSATAKGR\^L>WWDVCADMVGTFTDTEDPAKFKMKYWGVASFLQKGNDDHWI 
50 VDTDYDTYAVQYSCRLLNLDGTCADSYSFVFSRDPNGLPPEAQKIVRQRQEELCLARQYRLIVH 
NGYCDGRSERNLL 

SEQ ID N° 6>gi|72085|pir||VAHU plasma retinol-binding protein precursor - human 
MKWVWALLLLAAWAAAERDCRVSSFRVKENFDKARFSGTWYAMAKKPPEGLFLQDNIVAEFS 
55 VODETGQMSATAKGRWLLNNWDVCADMVGTFTDTEDPAKFKMKYWGVASFLQKGNDDHWI 
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VDTDYDTYAVQYSCRLLNLDGTCADSYSFVFSRDPNGLPPEAQKIVRQRQEELCLARQYRLIVH 
NGYCDGRSERNLL 

SEQ ID N° 7>gi|225862jprfl)1401251A retinol binding protein fHomo sapiens] 
5 ERDCRVSSFRVKENFDKARFSGTWYAMAKKDPEGLFLQDNIVAEFSVDETGQMSATAKGRVRL 
LNNWDVCADMVGTFTDTEDPAKFKMKYWGVASFLQKGNDDHWIVDTDYDTYAVQYSCRLL 
NLDGTCADSYSFVFSRDPNGLPPEAQKIVRQRQEELCLARQYRLIVHNGYCDGRSERNL 

SEQ ID N-'g 

10 MQSLMQAPLL lALGLLLATP AQAHLKKPSQ LSSFSWDNCD EGKDPAVIRS LTLEPDPIW 
PGNVTLSWG STSVPLSSPL KVDLVLEKEV AGLWIKIPCT DYIGSCTFEH FCDVLDMLIP 
TGEPCPEPLR TYGLPCHCPF KEGTYSLPKS EF\AAPDLELP SWLTTGNYRI ESVLSSSGKR 
LGCIKIAASL KGI 



15 SEQ ID N°9 

MQSLMQAPLL lALGLLLATP AQAHLKKPSQ LSSFSWDNCF EGKDPAVIRS LTLEPDPIW 
PGNVTLSWG STSVPLSSPL KVDLVLEKEV AGLWIKIPCT DYIGSCTFEH FCDVLDMLIP 
TGEPCPEPLR TYGLPCHCPF KEGTYSLPKS EFAVPDLELP SWLTTGNYRI ESVLSSSGKR 
LGCIKIAAST.KGI 

20 

SEQ ID N° 10 >gi|226416iprn|15U095A Gni2 activaior protein (Homo sapiens) 

LLATFAQAHLKKPSQLSSFSVVDNCDEGKDFAVIRSLTLEFDPIVWGNVTLSVVGSTSVPLSSFLK 
VDLV 

LEKEVAGLWIKIPCTDYIGSCTFEHFCDVLDMLIPTGEPCPEPLRTYGLPCHCPFKEGTYSLPKSEF 
25 WP 

DLELPSWLTTGNYRIESVLSSSGKRLGCIKIAASLKGI 



SEQ ID N** 11 >gi(3 1857|emb|CAA43408. 1( GM2-ac(ivator protein 

RAGPPFPMQSLMQAPLLIALGLLLAAPAQAKLKKPSQLSSFSWDNCDEGKDPAVIRSLTLEPDPII 
30 VPGN 

VTLSVMGSTSVPLSSPLKVDLVLEKEVAGLWIKIPCTDYIGSCTFEHFCDVLDMLIPTGEPCPEPL 
RTYG 

LPCHCPFKEGTYSLPKSEFWPDLELPSWLTTGNYRIESVLSSSGKRLGCIKIAASLKGI 



35 SEQID N° 12 >gi|673416|ejnbjCAA43994.1) GM2 activaior protein 

MQAPLUALGLLLATPAQAHLKJ<PSQLSSFSWDNCDEGKDPAV1RSLTLEPDP1VVPGNVIXSW 
GSTSV 

Pl^SPLKWLVLEKEVAGLWlKIPCTOYIGSCTFEHDFCDVLDMLIPTGEPCPEPLRTYGLPCHCPFK 
EGT 

40 YSLPKSEFVVPDLELPSWLTTG>fYRIESVLSSSGKRLGCrKiAASLKGI 



SEQ ID N** 13 >gi|2l353021pir||I54178 GM2-activaior protein - human 

MQSLMQAPLLIALGLLLATPAQAHLKKPSQLSSFSWDNCDEGKDPAVIRSLTLEPDPIWPGNVT 
LSWG 

45 STSVPLSSPLKVDLVLEKEVAGLWIKIPCTDYIGSCTFEHFCDVLDMLIPTGEPCPEPLRTYGLPCH 
CPF 

KEGTYSLPKSEFWPDLELPSWLTTGNYRIESVLSSSGKRLGCIKIAASLKGI 

SEQ ID N*' l4>gil4587479|gb|AAD25741.1|AF124719 1 GM2 activator protein 
50 MQSLMQAPLLIALGLLLATPAQAHLKKPSQLSSFSWDNCDEGKDPAVIRSLTLEPDPIVVPGNVT 
LSWG 9 

STSVPLSSPLKVDLVLEKEVAGLWIKIPCTDYJGSCTFEHFCDVLDMLIPTGEPCPEPLRTYGLPCH 
CPF 

KEGTYSLPKSEFWPDLELPSWLTTGNYRIESVLSSSGKRLGCIKIAASLKGI 



55 
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SEQ ID N° 13 >gi!45O40291rcnNP_O00396.l|pGM2Al GM2 ganglioside aclivaior proiein 

MQSLMQAPLLTALGLLLATPAQAHLKKPSQLSSFSWDNCDEGKDPAVIRSLTLEPDPIWPGNVT 
LSWG 

STSVPLSSPLKVDLVLEKEVAGLWIKIPCTDYIGSCTFEHFCDVLDMLIPTGEPCPEPLRTYGLPCH 
5 CPF 

KEGTYSLPKSEFWPDLELPSWLTTGNYRIESVLSSSGKRLGCIKIAASLKGI 

SEQ ID N*" 16 >gi|266988|sp|PI7900|SAP3 HUMAN GANGLIOSIDE GM2 ACTIVATOR 
PRECURSOR 

10 (CEREBROSIDE SULFATE ACTIVATOR PROTEIN) (SHINGOLIPID ACTIVATOR PROTEIN 3) 
(SAP.3) 

MQSLMQAPLLIALGLLLATPAQAHLKKPSQLSSFSWDNCDEGKDPAVIRSLTLEPDPIWPGNVT 

LSWGSTSVPLSSPLKVDLVLEKEVAGLWIKIPCTDYIGSCTFEHFCDVLDMLIPTGEPCPEPLRTY 

GLPCHCPF 

15 KEGTYSLPKSEFWPDLELPSWLTTGNYRIESVLSSSGKRLGCIKIAASLKGI 

SEQ ID N° 17>gi|225793Iprf]|I31335IB Ca binding protein MRP 1 4 [Homo sapiens] 

MTCKMSQLERNIETIINTFHQYSVKLGHPDTLNQGEFKELVRKDLQNFLKKENKNEKVIEHIMED 

LDTNADKQLSFEEFIMLMARLTWASHEKMHEGDEGPGHHHKPGLGEGTP 

20 

SEQ ID N° l8>gi!n5442|sp|P05 109|S108_HUMAN CALGRANULIN A (MIGRATION INHIBITORY 
FACTOR-RELATED PROTEIN 8) (MRP-8) (CYSTIC FIBROSIS ANTIGEN) (CFAG) (P8) 
(LEUKOCYTE LI COMPLEX LIGHT CHAIN) (SlOO CALCIUM -BINDING PROTEIN A8) 
MLTELEKALNSIIDVYHKYSLIKGNFHAVYRDDLKKLLETECPQYIRKKGADVWFKELDINTDG 
25 AVNFQEFLILVIKMGVAAHKKSHEESHKE 

SEQ ID N° I9>gi|2507565(sp|P805111Sll2_HUMAN CALGRANULIN C (CAGC) (P6) (CGRP) 
(NEUTROPHILS 1 00 PROTEIN) (CALCIUM-BINDING PROTEIN IN AMNIOTIC FLUID 1) 
(CAAFl) 

30 MTKLEEHLEGIVNIFHQYSVRKGHFDTLSKGELKQLLTKELANTIKNIKDKAVIDEIFQGLDANQ 
DEQVDFQEFISLVAIALKAAHYHTHKE 

SEQ ID N° 20>gi(1 15444|sp|P06702|S109_HUMAN CALGRANULIN B (MIGRATION INHIBITORY 
FACTOR-RELATED PROTEIN 14) (MRP-14) (P14) (LEUKOCYTE LI COMPLEX HEAVY 
35 CHAIN) 

(SlOO CALCIUM-BINDING PROTEIN A9) 

MTCKMSQLERNIETIINTFHQYSVKLGHPDTLNQGEFKELVRKDLQNFLKKENKNEKVIEHIMED 
LDTNADKQLSFEEFIMLMARLTWASHEKMHEGDEGPGHHHKPGLGEGTP 

40 SEQ ID N° 21 >gi|2I46972|pir||JC489I SlOO AI2 protein - human 

TKLEEHLEGIVNIFHQYSVRKGHFDTLSKGELKQLLTKELANTIKNIKDKAVIDEIFQGLDANQDE 
QVDFQEFISLVAIALKAAHYHTHKE 

SEQ ID N° 22 >gil625310|pir||BCHUCF calcium-binding protein MRP-8 - human 
45 MLTELEKALNSIIDVYHKYSLIKGNFHAVYRDDLKKLLETECPQYIRKKGADVWFKELDINTDG 
AVNFQEFLILVIKMGVAAHKKSHEESHKE 

SEQ ID N** 23 >gil2M9369|pirl|JC47l2 amniotic fluid-l calcium-binding protein homologuc - 
human 

50 MTKLEEHLEGIVNIFHQYSVRKGHFDTLSKGELKQLLTKELANTIKNIKDKAVIDEIFQGLDANQ 
DEQVDFQEFISLVAIALKAAHYHTHKE 

SEQ ID N°24 

DNGDVCQDCI QMVTDIQTAV RTNSTFVQAL VEHVKEECDR LGPGMADICK NYISQYSEIA 60 
55 IQMMMHMQDQ QPKEICALVG FCDEV 85 
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SEQ ID 25>gi|4506905|renNP_000533.1|pSFTPB| surfactant, pulmonary-associated protein B 
MAESHLLQWLLLLLPTLCGPGTAAWTTSSLACAQGPEFWCQSLEQALQCRALGHCLQEVWGH 
VGADDLCQECEDIVHILNKMAKEATFQDTMRKFLEQECNVLPLKLLMPQCNQVLDDYFPLVIDY 
5 FQNQroSNGICMHLGLCKSRQPEPEQEPGMSDPLPKPLRDPLPDPLLDKLVLPVLPGALQARPGP 
HTQDLSEQQFPIPLPYCWLCRALIKRIQAMIPKGALRVAVAQVCRWPLVAGGICQCLAERYSVI 
LLDTLLGRMLPQLVCRLVLRCSMDDSAGPRSPTGEWLPRDSECHLCMSVTTQAGNSSEQAIPQA 
MLQACVGSWLDREKCKQFVEQHTPQLLTLVPRGWDAHTTCQALGVCGTMSSPLQCIHSPDL 

10 SEQ ID N" 26 >gi|l31418|spIP079881PSPB^HUMAN PULMONARY SURFACTANT-ASSOCIATED 
PROTEIN B 

PRECURSOR (SP-B) (6 KD PROTEIN) (PULMONARY SURFACTANT-ASSOCIATED 
PROTEOLIPID SPL(PHE)) (18 KD PULMONARY-SURFACTANT PROTEIN) 
MAESHLLQWLLLLLPTLCGPGTAAWTTSSLACAQGPEFWCQSLEQALQCRALGHCLQEVWGH 
15 VGADDLCQECEDIVHILhnCMAKEAlFQDTMRFCFLEQECNVLPLKLLMPQCNQVLDDYFPLVIDy 
FQNQTDSNGICMHGLCKSRQPEPEQEPGMSDPLPKPLRDPLPDPLLDKJLVLPVLPGALQARPGPH 
TQDLSEQQFPIPLPYCWLCRALIKRIQAMIPKGALAVAVAQVCRWPLVAGGICQCLAERYSVIL 
LDTLLGRMLPQLVCRLVLRCSMDDSAGPRSPTGEWLPRDSECHLCMSVTTQAGNSSEQAIPQAM 
LQACVGSWLDREKCKQFVEQHrPQLLTLVTRGWDAHTTCQALGVCGTMSSPLQCIHSPDL 

20 

SEQ ID N° 27 >gi|719801pirl|LNHUB pulmonary surfactant protein B precursor - human 
MAESHLLQWLLLLLPTLCGPGTAAWTTSSLACAQGPEFWCQSLEQALQCRALGHCLQEVWGH 
VGADDLCQECEDIVHILNKMAKEAIFQDTMRKFLEQECNVLPLKLLMPQCNQVLDDYFPLV7DY 
FQNQTDSNGICMHLGCKSRQPEPEQEPGMSDPLPKPLRDPLPDPLLDKLVLPVLPGALQARPGPH 
25 TQDLSEQQFPIPLPYCWCRALIKRIQAMTPKGALRVAVAQVCRWPLVAGGICQCLAERYSVILL 
DTLLGRMLPQLVCRLVLRCSMDDSAGPRSPTGEVVLPRDSECHLCMSVTTQAGNSSEQAIPQAML 
QACVGSWLDREKCKQFVEQHTPQLLTLVPRGWDAKTTCQALGVCGTMSSPLQCIHSPDL 

SEQ ID N° 28 >gi|1360694lpir||SAHUP saposin precursor - human 

30 MYALFLLASLLGAALAGPV^GLKECniGSAVWCQNVKTASDCGAVKHCLQTVWNKPTVKSLP 
CDICKDWTAAGDMLKDNATEEEILVYLEKTCDWLPKPNMSASCKEIVDSYLPVILDIIKGEMSR 
PGEVCSALNLCESLQKHLAELNHQKQLESNKiPELDMTEWAPFMANIPLLLYPQDGPRSKPQPK 
DNGDVCQDCIQMVTDIQTAVRTNSTFVQALVEHVKEECDRLGPGMADICKNYISQYSEIAIQMM 
MHMQDQQPKEICALVGFCDEVKEMPMQTLVPAKVASKNVIPALELVEPIK.KHEVPAKSDVYCE 

35 VCEFLNaCE\nTa.IDNNKTEKEILDAFDKJV!CSKLPKSLSEECQEVVDTYGSSILSILLEEVSPELVC 
SMLHLCSGTRLPALTVHVTQPKDGGFCEVCKJCLVGYLDRNLEKNSTKQEILAALEKGCSFLPDP 
YQKQCDQFVAEYEPVLIEILVEVMDPSFVCLKIGACPSAHKPLLGTEKCIWGPSYWCQNTETAA 
QCNAVEHCKRHVWN 

40 SEQ ID N° 29 >gi|134218|sp!PO7602|SAP_HUMAN PROACTIVATOR POLYPEPTIDE 
PRECURSOR [CONTAINS: 

SAPOSIN A (PROTEIN A); SAPOSIN B (SPHINGOLIPID ACTIVATOR PROTEIN 1) (SAP-1) 
(DISPERSIN) (SULFATIDE/GMI ACTIVATOR); SAPOSIN C (CO-BETA -GLUCOSIDASE) (Al 
ACTIVATOR) (GLUCOSYLCERAMIDASE ACTIVATOR) (SPHINGOLIPlD> 

45 MYALFLLASLLGAALAGPVLGLKECTRGSAVWCQNVKTASDCGAVKHCLQTVWNKPTVKSLP 
CDICFCDVVTAAGDMLKDNATEEEILVYLEKTCDVVLPKPNMSASCKEIVDSYLPVILDIIKGEMSR 
PGEVCSALLCESLQKHLAELNHQKQLESNKIPELDMTEVVAPFMANIPLLLYPQDGPRSKPQPKD 
NGDVCQDCIQMVTDIQTAVRTNSTFVQALVEHVKEECDRLGPGMADICKNYISQYSEIAIQMM 
MHMQPK£ICALVGFCDEVKEMPMQTLVPAKVASKNVIPALELVEPIKKHEVPAKSDVYCEVCE 

50 FLVKEVTKLIDNNKTEKEILDAFDFCMCSKXPKSLSEECQEWDTYGSSILSILLEEVSPELVCSML 
HLCSGTRLPALTVHVTQPKDGGFCEVCKKLVGYLDRNLEKNSTKQEILAALEKGCSFLPDPYQK 
QCDQFVAEYEPVLIEILVEVMDPSFVCLKIGACPSAHKPLLGTEKCIWGPSYWCQNTETAAQCN 
AVEHCKRHVWN 
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SEQ ID N° 30>gi|186542|gb|J03912. 1|HUMIRBPM Human inierslilial relinol binding protein 
(IKBP) mRNA, complete cds 

ATGAGAGAATGGGTTCTGCTCATGTCCGTGCTGCTCTGTGGCCTGGCTGGCCCCACACACCT 
GTTCCAGCCAAGCCTGGTGCTGGACATGGCCAAGGTCCTCTTGGATAACTACTGCTTCCCG 
5 GAGAACCTGCTGGGCATGCAGGAAGCCATCCAGCAGGCCATCAAGAGCCATGAGATTCTG 
AGCATCTCAGACCCGCAGACGCTGGCCAGTGTGCTGACAGCCGGGGTGCAGAGCTCCCTGA 
ACGATCCTCGCCTGGTCATCTCCTATGAGCCCAGCACCCCCGAGCCTCCCCCACAAGTCCCA 
GCACTCACCAGCCTCTCAGAAGAGGAACTGCTTGCCTGGCTGCAAAGGGGCCTCCGCCATG 
AGGTTCTGGAGGGTAATGTGGGCTACCTGCGGGTGGACAGCGTCCCGGGCCAGGAGGTGCT 
10 GAGCATGATGGGGGAGTTCCTGGTGGCCCACGTGTGGGGGAATCTCATGGGCACCTCCGCC 
TTAGTGCTGGATCTCCGGCACTGCACAGGAGGCCAGGTCTCTGGCATTCCCTACATCATCTC 
CTACCTGCACCCAGGGAACACCATCCTGCACGTGGACACTATCTACAACCGCCCCTCCAAC 
ACCACCACGGAGATCTGGACCTTGCCCCAGGTCCTGGGAGAAAGGTACGGTGCCGACAAG 
GATGTGGTGGTCCTCACCAGCAGCCAGACCAGGGGCGTGGCCGAGGACATCGCGCACATCG 
15 TTAAGCAGATGCGCAGGGCCATCGTGGTGGGCGAGCGGACTGGGGGAGGGGCCCTGGACC 
TCCGGAAGCTGAGGATAGGCGAGTCTGACTTCTTCTTCACGGTGCCCGTGTCCAGGTCCCTG 
GGGCCCCTTGGTGGAGGCAGCCAGACGTGGGAGGGCAGCGGGGTGCTGCCCTGTGTGGGG 
ACTCCGGCCGAGCAGGCCCTGGAGAAAGCCCTGGCCATCCTCACTCTGCGCAGCGCCCTTC 
CAGGGGTAGTCCACTGCCTCCAGGAGGTCCTGAAGGACTACTACACGCTGGTGGACCGTGT 
20 GCCCACCCTGCTGCAGCACTTGGCCAGCATGGACTTCTCCACGGTGGTCTCCGAGGAAGAT 
CTGGTCACCAAGCTCAATGCCGGCCTGCAGGCTGCGTCTGAGGATCCCAGGCTCCTGGTGC 
GAGCCATCGGGCCCACAGAAACTCCTTCTTGGCCCGCGCCCGACGCTGCAGCCGAAGACTC 
ACCAGGGGTGGCCCCAGAGTTGCCTGAGGACGAGGCTATCCGGCAAGCACTGGTGGACTCT 
GTGTTCCAGGTGTCGGTGCTGCCAGGCAATGTGGGCTACCTGCGCTTCGATAGTTTTGCTGA 
25 CGCCTCCGTCCTGGGTGTGTTGGCCCCATATGTCCTGCGCCAGGTGTGGGAGCCGCTACAG 
GACACGGAGCACCTCATCATGGACCTGCGCCACAACCCTGGAGGGCCATCCTCTGCTGTGC 
CCCTGCTCCTGTCCTACTTCCAGGGCCCTGAGGCCGGCCCCGTGCACCTCTTCACCACCTAT 
GATCGCCGCACCAACATCACGCAGGAGCACTTCAGCCACATGGAGCTCCCGGGCCCACGCT 
ACAGCACCCAACGTGGGGTGTATCTGCTCACCAGCCACCGCACCGCCACGGCCGCGGAGGA 
30 GTTCGCCTTCCTTATGCAGTCGCTGGGCTGGGCCACACTGGTAGGTGAGATCACCGCGGGC 
AACCTGCTGCACACCCGCACGGTGCCGCTGCTGGACACACCCGAAGGCAGCCTCGCGCTCA 
CCGTGCCGGTCCTCACCTTCATCGACAATCACGGCGAGGCCTGGCTGGGTGGTGGAGTGGT 
GCCCGATGCCATCGTGCTGGCCGAGGAGGCCCTGGACAAAGCCCAGGAAGTGCTGGAGTTC 
CACCAAAGCCTGGGGGCCTTGGTGGAGGGCACAGGGCACCTGCTGGAGGCCCACTATGCTC 
35 GGCCAGAGGTCGTGGGGCAGACCAGTGCCCTCCTGCGGGCCAAGCTGGCCCAGGGCGCCTA 
CCGCACAGCTGTGGACTTGGAGTCTCTGGCCTCTCAGCTCACAGCAGACCTCCAGGAGGTG 
TCTGGGGACCACCGCTTGCTAGTGTTCCACAGCCCTGGCGAGCTGGTGGTAGAGGAAGCAC 
CCCCACCACCCCCTGCTGTCCCCTCTCCAGAGGAGCTCACCTACCTTATTGAGGCCCTGTTC 
AAGACAGAGGTGCTGCCCGGCCAGCTGGGCTACCTGCGTTTTGACGCCATGGCTGAACTGG 
40 AGACAGTGAAGGCCGTGGGGCCACAGCTGGTGCGGCTGGTATGGCAACAG 

CTGGTGGACACGGCTGCGCTGGTGATCGACCTGCGCTACAACCCTGGCAGCTACTCCACGG 
CCATCCCGCTGCTCTGCTCCTACTTCTTTGAGGCAGAGCCCCGCCAGCACCTGTATTCTGTC 
TTTGACAGGGCCACCTCAAAAGTCACGGAGGTGTGGACCTTGCCCCAGGTCGCCGGCCAGC 
GCTACGGCTCACACAAGGACCTCTACATCCTGATGAGCCACACCAGTGGCTCTGCGGCCGA 
45 GGCCTTTGCACACACCATGCAGGACCTGCAGCGGGCCACGGTCATTGGGGAGCCCACGGCC 
GGAGGCGCACTCTCTGTGGGCATCTACCAGGTGGGCAGCAGCCCCTTATATGCATCCATGC 
CCACCCAGATGGCCATGAGTGCCACCACAGGCAAGGCCTGGGACCTGGCTGGTGTGGAGCC 
CGACATCACTGTGCCCATGAGCGAAGCCCTTTCCATAGCCCAGGACATAGTGGCTCTGCGT 
GCCAAGGTGCCCACGGTGCTGCAGACGGCCGGGAAGCTGGTGGCTGATAACTATGCCTCTG 
50 CCGAGCTGGGGGCCAAGATGGCCACCAAACTGAGCGGTCTGCAGAGCCGCTACTCCAGGGT 
GACCTCAGAAGTGGCCCTAGCCGAGATCCTGGGGGCTGACCTGCAGATGCTCTCCGGAGAC 
CCACACCTGAAGGCAGCCCATATCCCTGAGAATGCCAAGGACCGCATTCCTGGAATTGTGC 
CCATGCAGATCCCTTCCCCTGAAGTATTTGAAGAGCTGATCAAGTTTTCCTTCCACACTAAC 
GTGCTTGAGGACAACATTGGCTACTTGAGGTTTGACATGTTTGGGGACGGTGAGCTGCTCA 
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CCCAGGTCTCCAGGCTGCTGGTGGAGCACATCTGGAAGAAGATCATGCACACGGATGCCAT 
GATCATCGACATGAGGTTCAACATCGGTGGCCCCACATCCTCCATTCCCATCTTGTGCTCCT 
ACTTCTTTGATGAAGGCCCTCCAGTTCTGCTGGACAAGATCTACAGCCGGCCTGATGACTCT 
GTCAGTGAACTCTGGACACACGCCCAGGTTGTAGGTGAACGCTATGGCTCCAAGAAGAGCA 
5 TGGTCATTCTGACCAGCAGTGTGACGGCCGGCACCGCGGAGGAGTTCACCTATATCATGAA 
GAGGCTGGGCCGGGCCCTGGTCATTGG 

GGAGGTGACCAGTGGGGGCTGCCAGCCACCACAGACCTACCACGTGGATGACACCAACCTC 

TACCTCACTATCCCCACGGCCCGTTCTGTGGGGGCCTCGGATGGCAGCTCCTGGGAAGGGG 

TGGGGGTGACACCCCATGTGGTTGTCCCTGCAGAAGAGGCTCTCGCCAGGGCCAAGGAGAT 

10 GCTCCAGCACAACCAGCTGAGGGTGAAGCGGAGCCCAGGCCTGCAGGACCACCTGTAGGG 
AAGGGCCCCATAGGCAGAGCCCCAGGGCAGACAGAACCTCTGGGACACACACCAAGGGCA 
CTCCTGCAGGTGGCCCGGCCTGAGGTTCCCAGGAGCAGCAAAGGGGCCTGCTGAGCTCTGG 
TTAGGTTACAGCTGGAGGTGTGTATATATACACACACACACATGTATAT ACACA TATATAT 
GTGTATGTATATATATGTATATATATATGGCTTTCCAATAACCACCTAAATTTTAACAAAGG 

15 TTCCTTCTAAGTGGTAGAACTTGGGGTGGTATTTTTACCTTCCTTCTTCATACTTTGCTCTTT 
TTCTTAAATACTCATTAATGTGCATATATCATTATTTTCAGATGCAGCTATCATTATTCCAA 
AATACAAAATAA 

SEQ ID N°3 i> NA^AE = 'Reverse-Translalion of GM2 FPA.G' : TYPE = DNA 
20 ATGCARWS^^yTNATGCARGCNCCNYT^m^^JATHGC^^YTNGG^^r^^^lf'T^ 

GCNCARGCNCAYYTNAARAARCCNWSNCARYTNWSNWSNTTYWSNTGGGAYAAYTGYGAY 
GARGGNAARGAYCCNGCNGTNATHMGNWSNYTNACNYTNGARCCNGAYCCNATHGTNGTN 
CCNGGNAAYGTNACNYTNWSNGTNGTNGGNWSNACNWSNGTNCCNYTNWSNWSNCCNYT 
NAARGTNGAYYTNGTNYTNGARAARGARGTNGCNGGNYTNTGGATHAARATHCCNTGYAC 
25 NGAYTAYATHGGNWShn*GYACNTTYGARCAYTTYTGYGAYGTNYTNGAYATGYTNATHCC 
NACNGGNGARCChrrGYCCNGARCChTfTNMGNACNTAYGGhnrrNCCNTGYCAYTGYCChm 
YAARGARGGNAC^^'AYWS^^^TNCCNAARWSNGARTTYGTNGTNCCNGAYYTNGARYTNCC 
NWShTTGGYTNACNACNGGNAAYTAYMGNATHGARWSNGTNYTNWSNWSNWSNGGNAARM 
GNYTNGGNTGYATHAARATHGCNGCNWSNYTNAARGGNATH 

30 

SEQ ID N° 32>gi|45874751gb|AF1247I7. 1|HSGM2A1 Homo sapiens GM2 activator protein (GM2A) 
gene, eNon 1, complete sequence 

TTTCTTTGCGTAACCAATACTGGAAGGCATTTAAAGGACCTCTGCCGCCTCAGACCTTGCAG 
TTAACTCCGCCCTGACCCACCCTTCCCGATGCAGTCCCTGATGCAGGCTCCCCTCCTGATCG 

35 CCCTGGGCTTGCTTCTCGCGACCCCTGCGCAAGCCCACCTGAAAAAGGTGAGTGCACCCTC 
TTTTAAGAGTCTGTTTGCAGCCTCCTGGCCCAGCTACGGGTGTGCGGGTCTGGCTGAGATAT 
GGGGGTGGCCACTCCGTTCTCTAGAATTGGTTCTCTGCACTAGAGCCTTCCAAAGTAACTAA 
TTATGGGATTCTGGTCTGTACAATGAGGGTGGCCTCTAAAGACTTGTTCTGCTCCAGGCCCT 
TTTTGGAGAGATTAATCTCACGTCTGCACTCTCCTGCCCTCCCTCCAAGCGCCGGAGTGAAA 

40 ATGCAGACAGCCTTAAAACTAAGGCATTGCCCCCAAGAGATTCAGTCCTGTTAACCCTGCA 
CCTTACTCCTGACCCCCACTCCTTATGTCCCCCATGATAAGGCCTGCTG CCTC ATCTCTTCCC 
CTGCTCGAATGCCCTGAGGTCTTCCrGAGAGTTGGGAGGGTTTGAGAGCTTTCCAAGGCCA 
AGAGGATTCACTAAG 

45 SEQ ID N** 33 >gil4587476|gb|AF124718. 11HSGM2A2 Homo sapiens GM2 activator protein (GM2A) 
gene, cxon 2, complete sequence 

CAGGAGCTTGCCCTCTTGCTGGGATTCCAACGCTGGCTGGAGAGGAGTGGGCAGCAGGGAG 
GTGGGAAGTCAGAGAAGGTGCCCACCAAAGGCCTATTAGGTCAGTCTCCTGTTT GGAAG TT 
CCAGGTCTATCATATCCTGCCTTATAGTTTACAATACACTTTTGGGAGATTATGTCl"l'ri'GA 
50 GTCTTTTAGTTTAGTCCTGCCTATAAAATGAGTAGGATAAGTGTTATCCCAGGTTCATAGGT 
ATGGAGTCTCATAGATGAGGCTCAGGGACGGGGGTGCCTCA CCCAA GGTCACACTGCCAGG 
AGCTCATTTTTCCTGTGATCTGTGATAGTTTCTTTTGTCAACCTn^ 

GCTGCCTGATTGTCCCCAGCCATCCCAGCTCAGTAGCTTTTCCTGGGATAACTGTGATGAAG 
GGAAGGACCCTGCGGTGATCAGAAGCCTGACTCTGGAGCCTGACCCCATCGTCGTTCCTGG 
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AAATGTGACCCTCAGTGTCGTGGGCAGCACCAGTGTCCCCCTGAGTTCTCCTCTGAAGGTG 
AGCCTGGGGGTGGGTGGAGAAGGGGAGGTGCGAGGGTCTGGCCAGCAGGGGTACTGGGGC 
ATGTATGCTTGGGGAACTGTGAAGAATTTCAGAATCCTGGATTCCCAGAGAATAGTACAGG 
ACATGTAGATTCAGACACTCTTTCACAGGTTCATGGAATCTCAGGATCATAAGATTGAAAG 
5 GAATCTCTGATGTCAGCGCCAGCAACTTCCTGGTGAGGGCAGGAGTGACGGATACCTTGCA 
CCTGGCAGAAGCGTCCTGGCCTTCTCTGGGCCTGGTGGCCAACTGCTCATTATTATCTGACA 
GCTCTGGTTGGCCAATTTGGTTTTGCTGTTAATTATAAAATTGATATACCAATTAGCCAGTA 
ATATATAGTCACTTTAGAAAACACAAGTGGTCAAAAAATAAATAAAATAGGCCAAGTGTGG 
TAACirCATGCCTGTAATTCCCACACCCITAGGAGGCTGAAGGTGGGTGGGATCCnTTTTGA 
10 GG 

SEQ ID N° 34>gi|4587477|gblAF124719.1|HSGM2A3 Homo sapiens GM2 aciivator prolcin (GM2A) 
gene, exons 3 and 4, complete sequence; and complete cds 

ACAGTAGATGCCAGTGCATTTCAATGCAAGTGTTAGAGCCAATCAATGGGTAGTGACTACC 

15 TAAAGAATTTTAAGACTATGGATTGAGCATGATGGCTCACGGCCTGTAATCCCAGCCTTTG 
GAAGGTGAAGGTGAAAGGATTGCTTGAGGCCAGGAGTTCCAGACCAGCTTGGGCAACAAA 
GTGAGCCCCATCTCTACAAAAAATACAAAATTAGCTGGGTGTGGTGGCATGTGCCTGTCTG 
TGTTTCCCACCTACATGGGAGGCTGAGGCAGGAGGATCGTCTGAGCCCAGGAGTTTGAGGC 
TGCAGTGAGTGCAGTGAGCCATGATACAAAAAAAAAAAATAAAGAATTCTAAGTCTATGTA 

20 TAGTTCAGTGTAGGGGGAAAATTCACATTTGATTATTAATGTCTGCCATGGGCACAATAAT 
ACACTATACTCACACATGGGCCACAATGTTGCCATTCCTAGAACAGACTATCTCTAAGATCT 
CATCCAGTTAAAAATTCTATGATTAAAATATATTGCTGCTTTTTTGAAGACAGAAGAGCTGG 
TATGTTTGCCCrGGAATTTACACTTATAACCTTTTTCAAACCTTTGTTTTATTT^^ 
AGGTGGATTTAGTTTTGGAGAAGGAGGTGGCTGGCCTCTGGATCAAGATCCCATGCACAGA 

25 CTACATTGGCAGCTGTACCnTTGAACACTTCrGTGATGTGCTTGACATGTTAATTCCTACTG 
GGGAGCCCTGCCCAGAGCCCCTGCGTACCTATGGGCTTCCTTGCCACTGTCCCTTCAAAGA 
AGTAAGTACTTAGGGAGGAGAGAGCGTTACCCCTGTGGCTAAAGAGATGGGGTTTGGAGA 
GAAGGGTCTTTGCATTCTCCTTCTGCAGATCTGCATGTCTCTGGATTTGTAAGCCAGTGTGA 
CCTATCAGGAATCACTTATCTTCCGGGAGCCTCAGTTATCCATCTACGAAATGGGAGACTTG 

30 AACTTAGATGTGATCTTCAGGGCCCTTTATCCATATAATCCATGCTCTACAGTGCTATGGCC 
GTCTCTCATCTTGTGCGGCTGTTTTGAGAATGGGAAGAGGGGTGGTAGTTCATGGCTGCAA 
TCCTAGCAGTGGCTCTAGGAGAAAGACCCCATCAGTAGGCTCCCACTGACTGGCGGTCCAC 
TGGCTTTCCCGCAGGGAACCTACTCACTGCCCAAGAGCGAATTCGTTGTGCCTGACCTGGA 
GCTGCCCAGTTGGCTCACCACCGGGAACTACCGCATAGAGAGCGTCCTGAGCAGCAGTGGG 

35 AAGCGTCTGGGCTGCATCAAGATCGCTGCCTCTCTAAAGGGCATATAGCATGGCATCTGCC 
ACAGCAGAATGGAGCGGTGTGAGGAAGGTCCCTTTTCCTCTGTTTTGTGTTTGCCAAGGCC 
AAACTCCCACTCTCTGCCCCCCTTTAATCCCCTTTCTACAGTGAGTCCACTACCCTCACTGA 
AAATCATTTTGTACCACTTACATTTTAGGCTGGGGCAAGCAGCCCTGACCTAAGGGAGAAT 
GAGTTGGACAGTTCTTGATAGCCCAGGGCATCTGCTGGGCTGACCACGTTACTCATCCCCGT 

40 TAACATTCTCTCTAAAGAGCCTCGTTCATTTCCAAAGCAGTT AAGGAATG GGAACAGAGTG 
TTTTAGGACCTGAAGAATCTTTATGACTCTCTCTCTTTCTCTCrrill'rri 

SEQ ID N° 35>gi|4587475|gb|AF124717. 11HSGM2A I Homo sapiens GM2 activator protein (GM2A) 
gene, exon 1, complete sequence 

45 TTTCTTTGCGTAACCAATACTGGAAGGCATTTAAAGGACCTCTGCCGCCTCAGACCTTGCAG 
TTAACTCCGCCCTGACCCACCCTTCCCGATGCAGTCCCTGATGCAGGCTCCCCTCCTGATCG 
CCCTGGGCTTGCTTCTCGCGACCCCTGCGCAAGCCCACCTGAAAAAGGTGAGTGCACCCTC 
TTTTAAGAGTCTGTTTGCAGCCTCCTGGCCCAGCTACGGGTGTGCGGGTCTGGCTGAGATAT 
GGGGGTGGCCACTCCGTTCTCTAGAATTGGTTCTCTGCACTAGAGCCTTCCAAAGTAACTAA 

50 TTATGGGATTCTGGTCTGTACAATGAGGGTGGCCTCTAAAGACTTGTTCTGCTCCAGGCCCT 
TTTTGGAGAGATTAATCTCACGTCTGCACTCTCCTGCCCTCCCTCCAAGCGCCGGAGTGAAA 
ATGCAGACAGCCTTAAAACTAAGGCATTGCCCCCAAGAGATTCAGTCCTGTTAACCCTGCA 
CCTTACTCCTGACCCCCACTCCTTATGTCCCCCATGATAAGGCCTGCTGCCTCATCTCTTCCC 
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CTGCrCGAATGCCCTGAGGTCTTCCTGAGAGTTGGGAGGGTTTGAGAGCTTTCCAAGGCCA 
AGAGGATTCACTAAG 

SEQ ID N° 36>gi!45874761gb|AFl247!8. 1|HSGM2A2 Homo sapiens GM2 aclivaior protein (GM2A) 
5 gene, exon 2, complete sequence 

caggagcttgccctcttgctgggattccaacgctggctggagaggagtgggcagcagggag 
gtgggaagtcagagaaggtgcccaccaaaggcctattaggtcagtctcctgtttggaagtt 
ccaggtctatcatatcctgccttatagtttacaatacacttrrgggagattatgtcttttga 
gtcttttagtttagtcctgcctataaaatgagtaggataagtgttatcccaggttcataggt 

10 atggagtctcatagatgaggctcagggacgggggtgcctcacccaaggtcacactgccagg 
agctca'iutltcctgtgatctgtgatagtttcttttgtcaacclm'lm'lcttcttctccttcctt 
gctgcctgattgtccccagccatcccagctcagtagcttttcctgggataactgtgatgaag 
ggaaggaccctgcggtgatcagaagcctgactctggagcctgaccccatcgtcgttcctgg 
aaatgtgaccctcagtgtcgtgggcagcaccagtgtccccctgagttctcctctgaaggtg 

15 agcctgggggtgggtggagaaggggaggtgcgagggtctggccagcaggggtactggggc 
atgtatgcttggggaactgtgaagaatttcagaatcctggattcccagagaatagtacagg 
acatgtagattcagacactctttcacaggttcatggaatctcaggatcataagattgaaag 
gaatctctgatgtcagcgccagcaacttcctggtgagggcaggagtgacggataccttgca 
cctggcagaagcgtcctggccttctctgggcctggtggccaactgctcattattatctgaca 

20 gctctggttggccaatttggttttgctgttaattataaaattgatataccaattagccagta 
atatatagtcactttagaaaacacaagtggtcaaaaaataaataaaataggccaagtgtgg 
taacttcatgcctgtaattcccacacccttaggaggctgaaggtgggtgggatccrrtttga 
gg 

25 SEQ ID N° 37>gi|4587477|gb|AF124719.1iHSGM2A3 Homo sapiens GM2 activator protein (GM2A) 
gene, exons 3 and 4, complete sequence; and complete cds 

ACAGTAGATGCCAGTGCATTTCAATGCAAGTGTTAGAGCCAATCAATGGGTAGTGACTACC 

TAAAGAATTTTAAGACTATGGATTGAGCATGATGGCrCACGGCCTGTAATCCCAGCCTTTG 

GAAGGTGAAGGTGAAAGGATTGCTTGAGGCCAGGAGTTCCAGACCAGCTTGGGCAACAAA 

30 GTGAGCCCCATCTCTACAAAAAATACAAAATTAGCTGGGTGTGGTGGCATGTGCCTGTCTG 
TGTTTCCCACCTACATGGGAGGCTGAGGCAGGAGGATCGTCTGAGCCCAGGAGTTTGAGGC 
TGCAGTGAGTGCAGTGAGCCATGATACAAAAAAAAAAAATAAAGAATTCTAAGTCTATGTA 
TAGTTCAGTGTAGGGGGAAAATTCACATTTGATTATTAATGTCTGCCATGGGCACAATAAT 
ACACTATACTCACACATGGGCCACAATGTTGCCATTCCTAGAACAGACTATCTCTAAGATCT 

35 CATCCAGTTAAAAATTCTATGATTAAAATATATTGCTGCTTTTTTGAAGACAGAAGAGCTGG 
TATGTTTGCCCTGGAATTTACACTTATAACCTTTTTCAAACCTTTGTTTTA'l lM l 
AGGTGGATTTAGTTTTGGAGAAGGAGGTGGCTGGCCTCTGGATCAAGATCCCATGCACAGA 
CTACATTGGCAGCTGTACCTTTGAACACTTCTGTGATGTGCTTGACATGTTAATTCCTACTG 
GGGAGCCCTGCCCAGAGCCCCTGCGTACCTATGGGCTTCCTTGCCACTGTCCCTTCAAAGA 

40 AGTAAGTACTTAGGGAGGAGAGAGCGTTACCCCTGTGGCTAAAGAGATGGGGTTTGGAGA 
GAAGGGTCTTTGCATTCTCCTTCTGCAGATCTGCATGTCrCTGGATTTGTAAGCCAGTGTGA 
CCTATCAGGAATCACTTATCTTCCGGGAGCCTCAGTTATCCATCTACGAAATGGGAGACTTG 
AACTTAGATGTGATCTTCAGGGCCCTTTATCCATATAATCCATGCTCTACAGTGCTATGGCC 
GTCTCTCATCTTGTGCGGCTGTTTTGAGAATGGGAAGAGGGGTGGTAGTTCATGGCTGCAA 

45 TCCTAGCAGTGGCTCTAGGAGAAAGACCCCATCAGTAGGCTCCCACTGACTGGCGGTCCAC 
TGGCTTTCCCGCAGGGAACCTACTCACTGCCCAAGAGCGAATTCGTTGTGCCTGACCTGGA 
GCTGCCCAGTTGGCTCACCACCGGGAACTACCGCATAGAGAGCGTCCTGAGCAGCAGTGGG 
AAGCGTCTGGGCTGCATCAAGATCGCTGCCTCTCTAAAGGGCATATAGCATGGCATCTGCC 
ACAGCAGAATGGAGCGGTGTGAGGAAGGTCCCTTTTCCTCTGTTTTGTGTTTGCCAAGGCC 

50 AAACTCCCACTCTCTGCCCCCCTTTAATCCCCTTTCTACAGTGAGTCCACTACCCTCACTGA 
AAATCATTTTGTACCACTTACATTTTAGGCTGGGGCAAGCAGCCCTGACCTAAGGGAGAAT 
GAGTTGGACAGTTCTTGATAGCCCAGGGCATCTGCTGGGCTGACCACGTTACTCATCCCCGT 
TAACA1TCTCTCTAAAGAGCCTCGTTCATTTCCAAAGCAGTT AAGGAATG GGAACAGAGTG 
TTTTAGGACCTGAAGAATCTTTATGACTCTCrCTCTTTCTCTCl 11 I 1 U 1 



94 



SEQ ID N° 38>gi|4504028|renNM_000405. llGM2Aj Homo sapiens GM2 ganglioside activator 
protein (GM2A) mRNA 

TTTCTTTGCGTAACCAATACTGGAAGGCATTTAAAGGACCTCTGCCGCCTCAGACCTTGCAG 
5 TTAACTCCGCCCTGACCCACCCTTCCCGATGCAGTCCCTGATGCAGGCTCCCCTCCTGATCG 
CCCTGGGCrrGCTTCTCGCGACCCCTGCGCAAGCCCACCTGAAAAAGCCATCCCAGCTCAG 
TAGCTTTTCCTGGGATAACTGTGATGAAGGGAAGGACCCTGCGGTGATCAGAAGCCTGACT 
CTGGAGCCTGACCCCATCGTCGTTCCTGGAAATGTGACCCTCAGTGTCGTGGGCAGCACCA 
GTGTCCCCCTGAGTTCTCCTCTGAAGGTGGATTTAGTTTTGGAGAAGGAGGTGGCTGGCCTC 

10 TGGATCAAGATCCCATGCACAGACTACATTGGCAGCTGTACCTTTGAACACTTCTGTGATGT 
GCTTGACATGTTAATTCCTACTGGGGAGCCCTGCCCAGAGCCCCTGCGTACCTATGGGCTTC 
CTTGCCACTGTCCCTTCAAAGAAGGAACCTACTCACTGCCCAAGAGCGAATTCGTTGTGCCT 
GACCTGGAGCTGCCCAGTTGGCTCACCACCGGGAACTACCGCATAGAGAGCGTCCTGAGCA 
GCAGTGGGAAGCGTCTGGGCTGCATCAAGATCGCTGCCTCTCTAAAGGGCATATAGCATGG 

15 CATCTGCCACAGCAGAATGGAGCGGTGTGAGGAAGGTCCCTTTTCCTCTGTTTTGTGTTTGC 
CAAGGCCAAACTCCCACTCTCTGCCCCCCTTTAATCCCCTTTCTACAGTGAGTCCACTACCC 
TCACTGAAAATCATTTTGTACCACTTACATTTTAGGCTGGGGCAAGCAGCCCTGACCTAAG 
GGAGAATGAGTTGGACAGTTCTTGATAGCCCAGGGCATCTGCTGGGCTGACCACGTTACTC 
ATCCCCGTTAACATTCTCTCTAAAGAGCCTCGTTCATTTCCAAAGCAGTTAAGGAATGGGA 

20 ACAGAGTGTTTTAGGACCTGAAGAATCTTTATGACTCTCTCTCTTTCTCTC l i' l ^ 

SEQ ID N** 39>gi|4587476!gbjAFI24718.I|HSGM2A2 Homo sapiens GM2 activator protein (GM2A) 

gene, exon 2, complete sequence 

CAGGAGCTTGCCCTCTTGCTGGGATTCCAACGCTGGCTGGAGAGGAGTGGGCAGCAGGGAG 

25 GTGGGAAGTCAGAGAAGGTGCCCACCAAAGGCCTATTAGGTCAGTCTCCTGTTTGGAAGTT 
CCAGGTCTATCATATCCTGCCTTATAGTTTACAATACACTTTTGGGAGATTATGTCTTTTGA 
GTCTTTTAGTTTAGTCCTGCCTATAAAATGAGTAGGATAAGTGTTATCCCAGGTTCATAGGT 
ATGGAGTCTCATAGATGAGGCTCAGGGACGGGGGTGCCTCACCCAAGGTCACACTGCCAGG 
AGCTCATTTTTCCTGTGATCTGTGATAGTTTCTTTTGTCAACCTTTTTCT^ 

30 GCTGCCTGATTGTCCCCAGCCATCCCAGCTCAGTAGCrTTTCCTGGGATAACTGTGATGAAG 
GGAAGGACCCTGCGGTGATCAGAAGCCTGACTCTGGAGCCTGACCCCATCGTCGTTCCTGG 
AAATGTGACCCTCAGTGTCGTGGGCAGCACCAGTGTCCCCCTGAGTTCTCCTCTGAAGGTG 
AGCCTGGGGGTGGGTGGAGAAGGGGAGGTGCGAGGGTCTGGCCAGCAGGGGTACTGGGGC 
ATGTATGCTTGGGGAACTGTGAAGAATTTCAGAATCCTGGATTCCCAGAGAATAGTACAGG 

35 ACATGTAGATrCAGACACTCTTTCACAGGTTCATGGAATCTCAGGATCATAAGATTGAAAG 
GAATCTCTGATGTCAGCGCCAGCAACTTCCTGGTGAGGGCAGGAGTGACGGATACCTTGCA 
CCTGGCAGAAGCGTCCTGGCCTTCTCTGGGCCTGGTGGCCAACTGCTCATTATTATCTGACA 
GCTCTGGTTGGCCAATTTGGTTTTGCTGTTAATTATAAAATTGATATACCAATTAGCCAGTA 
ATATATAGTCACTTTAGAAAACACAAGTGGTCAAAAAATAAATAAAATAGGCCAAGTGTGG 

40 TAACTTCATGCCTGTAATTCCCACACCCTTAGGAGGCTGAAGGTGGGTGGGATCCTTTTTGA 
GG 

SEQ ID N° 40 >gi|4587477|gbIAF124719. 1|HSGM2A3 Homo sapiens GM2 activator protein (GM2A) 
gene, exons 3 and 4, complete sequence; and complete cds 

45 ACAGTAGATGCCAGTGATTTCAATGCAAGTGTTAGAGCCAATCAATGGGTAGTGACTACCT 
AAAGAATTTTAAGACTATGGArrGAGCATGATGGCTCACGGCCTGTAATCCCAGCCTTTGG 
AAGGTGAAGGTGAAAGGATTGCTTGAGGCCAGGAGTTCCAGACCAGCTTGGGCAACAAAG 
TGAGCCCCATCTCTACAAAAAATACAAAATTAGCTGGGTGTGGTGGCATGTGCCTGTCTGT 
GTTTCCCACCTACATGGGAGGCTGAGGCAGGAGGATCGTCTGAGCCCAGGAGTTTGAGGCT 

50 GCAGTGAGTGCAGTGAGCCATGATACAAAAAAAAAAAATAAAGAATTCTAAGTCTATGTAT 
AGTTCAGTGTAGGGGGAAAATTCACATTTGATTATTAATGTCTGCCATGGGCACAATAATA 
CACTATACTCACACATGGGCCACAATGTTGCCATTCCTAGAACAGACTATCTCTAAGATCTC 
ATCCAGTTAAAAATTCTATGATTAAAATATATTGCTGCTTTTTTGAAGACAGAAGAGCTGGT 
ATGTTTGCCCTGGAATTTACACTTATAACCTTTTTCAAACCTTTGTTTTATTTTTT^^ 
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GGTGGATTTAGTTTTGGAGAAGGAGGTGGCTGGCCTCTGGATCAAGATCCCATGCACAGAC 
TACATTGGCAGCTGTACCTTTGAACACTTCTGTGATGTGCTTGACATGTTAATTCCTACTGG 
GGAGCCCTGCCCAGAGCCCCTGCGTACCTATGGGCTTCCTTGCCACTGTCCCTTCAAAGAA 
GTAAGTACTTAGGGAGGAGAGAGCGTTACCCCTGTGGCTAAAGAGATGGGGTTTGGAGAG 
5 AAGGGTCTTTGCATTCTCCTTCTGCAGATCTGCATGTCTCTGGATTTGTAAGCCAGTGTGAC 
CTATCAGGAATCACTTATCTTCCGGGAGCCTCAGTTATCCATCTACGAAATGGGAGACTTG 
AACTTAGATGTGATCTTCAGGGCCCTTTATCCATATAATCCATGCTCTACAGTGCTATGGCC 
GTCTCTCATCTTGTGCGGCTGTTTTGAGAATGGGAAGAGGGGTGGTAGTTCATGGCTGCAA 
TCCTAGCAGTGGCTCTAGGAGAAAGACCCCATCAGTAGGCTCCCACTGACTGGCGGTCCAC 

10 TGGCTTTCCCGCAGGGAACCTACTCACTGCCCAAGAGCGAATTCGTTGTGCCTGACCTGGA 
GCTGCCCAGTTGGCTCACCACCGGGAACTACCGCATAGAGAGCGTCCTGAGCAGCAGTGGG 
AAGCGTCTGGGCTGCATCAAGATCGCTGCCTCTCTAAAGGGCATATAGCATGGCATCTGCC 
ACAGCAGAATGGAGCGGTGTGAGGAAGGTCCCTTrrCCTCTGTTTTGTGTTTGCCAAGGCC 
AAACTCCCACTCTCTGCCCCCCTTTAATCCCCTTTCTACAGTGAGTCCACTACCCTCACTGA 

15 AAATCATTTTGTACCACTTACATTTTAGGCTGGGGCAAGCAGCCCTGACCTAAGGGAGAAT 
GAGTTGGACAGTTCTTGATAGCCCAGGGCATCTGCTGGGCTGACCACGTTACTCATCCCCGT 
TAACATTCTCTCTAAAGAGCCTCGTTCATTTCCAAAGCAGTTAAGGAATGGGAACAGAGTG 
TTTTAGGACCTGAAGAATCTTTATGACTCTCTCTCTTTCTCTCriTTTTTT 



20 SEQ ID N° 4 1 >gil4504028|rcflNM_000405. 1 |GM2 A| Homo sapiens GM2 gangliosidc aclivator 
protein (GM2A) mRNA 

TTTCTTTGCGTAACCAATACTGGAAGGCATTTAAAGGACCTCTGCCGCCTCAGACCTTGCAG 
TTAACTCCGCCCTGACCCACCCTTCCCGATGCAGTCCCTGATGCAGGCTCCCCTCCTGATCG 
CCCTGGGCTTGCTTCTCGCGACCCCTGCGCAAGCCCACCTGAAAAAGCCATCCCAGCTCAG 

25 TAGCTTTTCCTGGGATAACTGTGATGAAGGGAAGGACCCTGCGGTGATCAGAAGCCTGACT 
CTGGAGCCTGACCCCATCGTCGTTCCTGGAAATGTGACCCTCAGTGTCGTGGGCAGCACCA 
GTGTCCCCCTGAGTTCTCCTCTGAAGGTGGATTTAGTTTTGGAGAAGGAGGTGGCTGGCCTC 
TGGATCAAGATCCCATGCACAGACTACATTGGCAGCTGTACCTTTGAACACTTCTGTGATGT 
GCTTGACATGTTAATTCCTACTGGGGAGCCCTGCCCAGAGCCCCTGCGTACCTATGGGCTTC 

30 CTTGCCACTGTCCCTTCAAAGAAGGAACCTACTCACTGCCCAAGAGCGAATTCGTTGTGCCT 
GACCTGGAGCTGCCCAGTTGGCTCACCACCGGGAACTACCGCATAGAGAGCGTCCTGAGCA 
GCAGTGGGAAGCGTCTGGGCTGCATCAAGATCGCTGCCTCTCTAAAGGGCATATAGCATGG 
CATCTGCCACAGCAGAATGGAGCGGTGTGAGGAAGGTCCCTTTTCCTCTGTTTTGTGTTTGC 
CAAGGCCAAACTCCCACTCTCTGCCCCCCTTTAATCCCCTTTCTACAGTGAGTCCACTACCC 

35 TCACTGAAAATCATTTTGTACCACITACATTTTAGGCTGGGGCAAGCAGCCCTGACCTAAG 
GGAGAATGAGTTGGACAGTTCTTGATAGCCCAGGGCATCTGCTGGGCTGACCACGTTACTC 
ATCCCCGTTAACATTCTCTCTAAAGAGCCTCGTTCATTTCCAAAGCAGTTAAGGAATGGGA 
ACAGAGTGTTTTAGGACCTGAAGAATCTTTATGACTCTCrCTCTTTCrCTCrrrr^ 



40 SEQ ID ^42 > NAME = 'Reversc-Translalion of CALB FRE' : TYPE = DNA 

ATGACNTGYAARATGWSNCARYTNGARMGNAAYATHGARACNATHATHAAYACNTTYCAY 
CARTAYWSNGTNAARYTNGGNCAYCCNGAYACNYTNAAYCARGGNGARTTYAARGARYTN 
GTNMGNAARGAYYTNCAJ^AYTTYYTNAARAARGARAAYAARAAYGARAARGTNATHGAR 
CAYATHATGGARGAYYTNGAYACNAAYGCNGAYAARCARYTNWSbrrrYGARGARTTYATH 

45 ATGYTNATGGCNMGNYTNACNTGGGCNWSNCAYGARAARATGCAYGARGGNGAYGARGG 
NCCNGGNCAYCAYCAYAARCCNGGNYTNGGNGARGGNACNCCN 

SEQ ID N° 43>gi|188691|gb(M21005.1jHUMMRP8A Human migration inhibiioiy factor-related 
protein 8 (MRP8) gene, complete cds 
50 TTCCACCTTTTGGCTCTTGTAAATAATGCTGCTATGAACATGAATGTACAAACATCTGTTTG 
AATCCCTGCATTCAATTCTTTTGCATATATACCCAGGAGCAGAATGATGGATCATATGGTAA 
TTCTGTGTTTATTTATTTGAGGAACAAACTTGCCGTTTTCCATAACAGCTGCACT ATTTT AC 
ATTCCCACTAACAGTGCATTAGGCn'CCAATTCTCTATGCCCTCACCAACACTTGTTTTCTG 
GGTTTTAAAAGAAGTAGTAGTCATCCTTGTAGGTGTCAGGTGGTATCTCA7TGTCGTTTTGC 
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TTCATGTTTTCCTAAAGATTAGTAATTTTCATATGCITATrGACCATTTGTATATCTTCTTC^ 
GAGAAGTGTCTATTTGAGTCTTTCCCCAATTTTGATTGGTTTGTTTGl'lM'inTGTT 
TGTAGGGATTCTTTTATATTCTGGATATTAATCCCTTATCAGATATTTGTTrrACAAATATTT 
TCTTTGTAACAACAGAAACACACCACAGTCTTCAAGGTTGGAAGCCAGTTAATCTGAGTAG 
5 CATTTTGTTAGTGGTGGGGAGAGGATTTGTTCCTCCTGAAATCCTGGGGAATTGGCCACCTC 
CTCTTCTCCTCTTAGGCATGAAGCGCGTCTGGCTTCTCCAAAGAACTCTTCCCCTCCACTAC 
CTCAGAGTTAGCTTCCTCTCTTCAGCCAGTGATCCTGGGGTCCCAGACACAATAATTAACCA 
AGAGAGGGTGAAAGGCTCCCTGCTGTGTTTATGCAATGGCTCAGGCCCTTGTGAAGTGCCG 
AGGGACCCCAAGCAGCCTCCATCTCCCAGGGCATGGTCCATCCCCAGCTTTCACAGAACAG 

10 GAAAGCTGTGGAGGAGTGTGGGCAGCAGGGTAGGAATGGATATAGCCCTTGGCAACAACA 
CATTTCCCCACAAAGCACCCACCCAAAAGAACAACAACGATAGTTTTAGTTTTTAGTAATG 
AGAACAATAGTTCTCATGACTAAAAGCCATCAGCCAGGACACTGTTCTCAACCCmTGCG 
GTCTTTGGACCCTTTGAAACTCTGACAGAAGCCATGGAGGAATGTTCTCACTGAGTGCATG 
CACTCAAAATGATGCATTCAACrrCAATTCAGTTTCAGGGATGTATGGCCTGACCACCAAT 

15 GCAGGGGATTAGCAATCGCAATAGTGGAGAGGGCATGGGAGTGGGAATCTGGCTGGATCA 
AGCAAGTGGATGCCAGCAGCCCAGAAAAAGAGCCCCCCTACCTGCTTTTTCCTTCCTGGGC 
ACTATTGCCCAGCAAATGCCTTCCTCTTrCCGCTTCTCCTACCTCCCCACCCAAAATTTTCAT 
TCTGCACAGTGATTGCCACATTCACTGGTTGAGAAACAGAGACTGTAGCAACTCTGGCAGG 
GAGAAGCTGTCTCTGATGGCCTGAAGCTGTGGGCAGCTGGCCAAGCCTAACCGCTATAAAA 

20 AGGAGCTGCCTCTCAGCCCTGCATGTCTCTTGTCAGCTGTCTTTCAGAAGACCTGGTAAGTG 
GGACTGTCTGGGTTGGCCCCGCACTTTGGGCTTCTCTTGGGGAGGGTCAGGGAAGTGGAGC 
AGCCTTCCTGAGAGAGGAGAGAGAAAGCTCAGGGAGGTCTGGAGCAAAGATACTCCTGGA 
GGTGGGGAGTGAGGCAGGGATAAGGAAGGAGAGTATCCTCCAGCACCTTCCAGTGGGTAA 
GGGCACATTGTCTCCTAGGCTGGACTTTTCTTGAGCAGAGGGTGGGGTGGTAAGGAAAGTC 

25 TACGGGCCCCCGTGTGTGTGCACATGTCTCTGTGTGAATGGACCCTTCCCCTTCCCACACGT 
GTATCCCTATCATCCCACCCTTCCCACCAGAGGCCATAGCCATCTGCTGGTTTGGTTATTTG 
AGAGTGCAGGCCAGGACAAGGCCATCGCTTGGGGCATGAATCCTCTGCGTACTGCCCTGGC 
CAGATGCAAATTCCCTGCCATGGGATTCCCCAGAAGGTTCTGTTTTTCAGGTGGGGCAAGTT 
CCGTGGGCATCATGTTGACCGAGCTGGAGAAAGCCTTGAACTCTATCATCGACGTCTACCA 

30 CAAGTACTCCCTGATAAAGGGGAATTTCCATGCCGTCTACAGGGATGACCTGAAGAAATTG 
CTAGAGACCGAGTGTCCTCAGTATATCAGGGTGAGGAGGGGCTGGGTGTGGCGGGGGCTCT 
CTGCCTGGTCCTGGGGCTGCCCTGGGCCAGCGGTCCTCCCTGCCACCCTTCATAGATGCTAT 
GCCTCGGCTCTCTCTGAGATCTrTAAACTCTGGCTTCTTCCTCCTCAATCTTGACAGAAAAA 
GGGTGCAGACGTCTGGTTCAAAGAGTTGGATATCAACACTGATGGTGCAGTTAACTTCCAG 

35 GAGTTCCTCATTCTGGTGATAAAGATGGGCGTGGCAGCCCACAAAAAAAGCCATGAAGAA 
AGCCACAAAGAGTAGCTGAGTTACTGGGCCCAGAGGCTGGGCCCCTGGACATGTACCTGCA 
GAATAATAAAGTCATCAATACCTCATGCCTCTCTCTTATGCTTTTGTGGAATGAGGTTCCTC 
GGTGTGGAGGGAGGGTTGGAAAACCCAAAGGAAGAAAAAGAAATCTATGTTATCCCACCC 
TACCTCTCACAAGCCTTTCCTGCTTTACCCCTCACCTGGCCTCTGCCCCACATTCCTTCAGCC 

40 CCTCATTTCGAGCATTGGATTTGAGGCTTAAGGATTCAAAAAGTCGTCATGAATATAGCTG 
ATGATTTTATAGTGGTTCTGAAATGGGTCGGGGATTTGGGAACAGGGTGGTAGTATAAGAA 
CAACTGATACTGTTCTCTAAGCTAAATCTTAGCTTCCAGCTACCTGTCTTAGATGTGGCTCT 
TGGGAACCTTAGAGTGATAGCTACATAGAAGTGTGTGGGTGTGTGTGTGTGTGTCTGTGTG 
TGTGTGTGTGAGAGAGAGACAGACAGAAAGAGAGCAAGAGAGGGAAGGGGGGAGAGGCT 

45 GATrGTGTGTGTGGTGTGATGTAGGTGGACAATGTTCAGAGTCCTCCATTAACAGGATAAT 
CCTCACACCTGTCCACATACCTGTAGTTTGTCCTTGGGGATTTTGAAAATTTITCCTCCCTC^ 
CCACTCCCAAACTCCCAACTCAATTAAATGATAAAGGAATAGGCAAATAGGAAAATAAATT 
AGTAAAACTTAAGTCAAAGAATAGGTTATTCATACGCTGCCTATGGGATTCTATGCTTTGTG 
ATCAGAAAATTATCTAAAAAATACTTCCCAAGGGCTGGTACAAGGGAGGCCAGAAGACGA 

50 GTGGTTCTTCTCTGAGGTGGACATTAAAAAAAGAAGAAAATGAAGGGGAACCTTTTGACAA 
GAATGTCACCCCAAACTGGATTTTCATGCTGTGGTGTGGGGAATTTTCTGTTGTCCTCACTT 
AGGTGCTGGGGCAGTGGTGTTAGTGATGGGTAAAAAGGTAGGAAGCTGTCACAGAATCACT 
AAACCAGGGTTCTTAACTTGTCTGTCTATACATCTCTGAAATTGGGTTGAAGTTGTGTGCAT 
CATTTTGAGTGACGCACTGAGAACATTCCTCCACGGCTTCCATCGAGAGTCTCGAAAAGGC 
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CCAACACCTCAAAAAGGTTAAGAACACTTGTCCTGCTTACTGGTTTTTAGTAACAAATGGC 
AGAGTATTTCTCTCTGTCTCTCTCTCl 1 1 1 1 1 1 1 I 1 1 i i lVl 1 Tl GAGACACAGGGTCTTGTCT 

GTCACGTGGACTAGAGTACAATGGGCATGATCATGGGCTCACTGTAGCCTCGAACACCTGG 
GCTCAAGT AATCCT CCCAC CTCAGCCT CTTTAGTAGCTGGGACTACAGCATGAGCCACTGCC 
5 CTTGGCTAATTTTTAAATTATTTTTTTGTAGAOATGGAAACTTGCTATGTTGCCCAGGCTAG 
TCTCAAACTCCTGGACTCAAGCGATCCTCCTACCTTGGCCTCCCAAAGTGCTGAGATTACAG 
TGTGATCCACACCACACCTGGCCAAAGATTGGAGTATT-riTATTGCTATTGTTGTGCTGGGT 
GGGTGGGTGGGTGTATGCTTTGTGGGGACGTGTGTTGTTGCCAAGGGCTAAATCAGTTCCT 
ACCCTGCTGCCCACAGTCCTCCACAGCTTrCCTGCTCTGTGAAGCTAAGGATACACCCCGAT 
10 GATAAGCTGTCAACATA 

SEQ ID N° 44 >gi|4258693|gb|AI415I89.1|AI415189 mc07e05.xl Scares mouse p3NMF19.5 Mus 
muscuUis cDNA clone IMAGE:347840 3' similar to gb:X06233 CALGRANULIN B (HUMAN); 
gb:M83219 Mus nuisciilus intracellular calcium-binding protein (MOUSE);, niRNA 
15 sequence 

11 mil 11 1 1 1 1 11 ri I GGATAAAGACTTATTTATTATTTATCTTATCATTTCCCAGAACAA 
AGGCCATTGAGTAAGCCATTCCCTTTAAACrrTGGTTGGGCAGCTGTCACATGGCrrGACCTCT 
TAATTACTTCCCACAGCCTTTGCCATGA(rrGTGGCCATGCCCACGTGGGTTGTTCTCATGCA 
GCTTCTCATGACAGGCAAAGATCAACTTTGCCATCAGCATCATACACTCCTCAAAGCTCAG 
20 CTGATTGTCCTGGTTTGTGTCCAGGTCCTCCATGATGTCATTTATGAGGGCTTCATTTCTCTT 
CTCTTTCTTCATAAAAGGTTGCCAAACTGTGCTTCCCACCATTTGGTCTGAATTCCTTCTTGC 
TCAGGGTGTAGGGGNGGGTCTTCCnTCnTAAAGTATTGATGAAAGGGGGCCAGATGGGGGG 
GTTATGCTGCGCTCCATCTGAAAAGTGGCnTTGGTGGGCCAT 

25 SEQ ID W 45c!one IMAGE: 196 152 1 3' similar to gb:X06233 CALGRANULIN B (HUMAN);,mRNA 
sequence 

■rrrn-riTl rn l l l n i l l rri l GGAGGAAGAGACTTTATTTGGCCCCAGCCCCTAGCCCCA 
CAGCCAAGACAGTTTGACATAACAGGCCCCGGGGCCCTGGTTGGGTAGAGGCAGGGTGGC 
CTGGCCTCCTGATTAGTGGCTGTGGCCGTGGCCACCATGACTGTGGCCGTGGCCGGGGCCA 
30 CTGTGATCTTGGCCACTGTGGTCTTAGGGGGTGCCCTCCCCGAGGCCTGGCnTATGGTGGTG 
GCCAGGGCCCTCGTCACCCTCGTGCATTTTTTCGTGGGAGGCCCAGGTTAGCCTCGCCATCA 
GCATGATGAACTCCTGGAGCTCAGCTGCTTGTCTGCATTTGGGTCCAGGTCCTCCATGATGT 
GTTCTATGACCl 1 1 1 CATTCTTATTCTCCTTCTTGA 

35 SEQ ID N° 46 >gi|443720i|gbjAI523066.1|AI523066 ar68a07.xl Barslead aorta HPLRB6 Homo 
sapiens cDNA clone IMAGE:2127732 3' similar to gb:X06233 CALGRANULIN B 
(HUMAN);, mRNA sequence 

GGAGGAAGAGACTTTATTTGGCCCCAGCCCCTATCCCCACAGCCAAGACAGTTTGACATAA 
CAGGCCCCGGGGCCCTGGTTGGGTAAAGGCAGGGTGGCCTGGCCTCCTGATTAGTGGCTGT 
40 GGCCGTGGCCACCATGACTGTGGCCGTGGCCGTGGCCACTGTGATCTTGGCCACrrGTGGTC 
TTAGGGGGTGCCCTCCCCGAGGCCTGGCTTATGGTGGTGGCCAGGGCCCTCGTCACCCTCG 
TGCATCTTCrrCGTGGGAGGCCCAGGTTAGCCTCGCCATCAGCATGATGAACTCCTCGAAGC 
TCAGCTGCTTGTCTGCATTTGTGTCCAGGTCCTCCATGATGTGTTCTATGACCTTTTCATTCT 
TATTCTCCTTCTTGAGAAAATTTTGCAGATCITTTCGCACCAGCTCrrrNGAATTCCC 

45 

SEQ ID N*» 47 >gi|4506772|rcflNM_O02965.1|Sl00A9| Homo sapiens SlOO calcium-binding protein 
A9 (calgranulin B) (SI00A9) mRNA 

AATTCGCTCGGCTTTGACAGAGTGCAAGACGATGACTTGCAAAATGTCGCAG(rrGGAACGC 
AACATAGAGACCATCATCAACACCTTCCACCAATACTCTGTGAAGCrrGGGGCACCCAGACA 
50 CCCTGAACCAGGGGGAATTCAAAGAGCTGGTGCGAAAAGATCTGCAAAATTTTCTCAAGAA 
GGAGAATAAGAATGAAAAGGTCATAGAACACATCATGGAGGACCTGGACACAAATGCAGA 
CAAGCAGCTGAGCTTCGAGGAGTTCATCATGCTGATGGCGAGGCTAACCTGGGCCTCCCAC 
GAGAAGATGCACGAGGGTGACGAGGGCCCrrGGCCACCACCATAAGCCAGGCCTCGGGGAG 
GGCACCCCCTAAGACCACAGTGGCCAAGATCACAGTGGCCACGGCCATGGCCACAGTCATG 



98 



GTGGCCACGGCCACAGGCCACTAATCAGGAGGCCAGGCCACCCTGCCTCTACCCAACCAGG 
GCCCCGGGGCCTGTTATGTCAAACTGTCTTGGCTGTGGGGCTAGGGGCTGGGGCCAAATAA 
AGTCTCTTCCTCCAAGCT 

5 SEQ ID N° 48 >gi|4618444|gb|AI609277.1|AI609277 tw83gl2.xl NCI_CGAP_HN5 Homo sapiens 
cDNA 

clone IMAGE:2266342 3' similar to gb:X06233 CALGRANULIN B (HUMAN):, mRNA 
sequence 

GACTTGGAGGAAGAGACTTTATTTGGCCCCAGCCCCTAGCCCCACAGCCAAGACAGTTTGA 
10 CATAACAGGCCCCGGGGCCCTGGTTGGGTAGAGGCAGGGTGGCCTGGCCTCCTGATTAGTG 
GCTGTGGCCGTGGCCACCATGACTGTGGCCGTGGCCGTGGCCACTGTGATCTTGGCCACTG 
TGGTCTTAGGGGGTGCCCTCCCCGAGGCCTGGCTTATGGTGGTGGCCAGGGCCCTCGTCAC 
CCTCGTGCATCTTCTCGTGGGAGGCCCAGGTTAGCCTCGCCATCAGCATGATGAACTCCTCG 
AAGCTCAGCTGCTTGTCTGCATTTGTGTCCAGGTCCTCCATGATGTGTTCTATGACCTTTTC 
15 ATTCTTATTCTCCTTCTTGAGAAAATTTTGCAGATCTTTTCGCACCAGCTCTTTGAATTCCC 

SEQ ID N° 49>gi(4998166|gb|An08390.1|AI708390 atnb02.xl Barslead aorta HPLRB6 Homo 
sapiens cDNA clone IMAGE:2354955 3' similar (o gb:X06233 CALGRANULIN B 
(HUMAN);, mRNA sequence 
20 TGACTTGGAGGAAAAAACTTTATTTGGCCCCAGCCCCTAGCCCCACAGCCAAAACAGTTTG 
ACATAACAGGCCCCGGGGCCCTGGTTGGGTAGAGGCAGGGGGGCCTGGCCTCCTGATTAGT 
GGCTGTGGCCGGGGCCACCATGACTGTGGCCGGGGCCGGGGCCACTGTGATCTTGCCACTG 
GGGTCTTAGGGGGTGCCCTCCCCGAGGCCTGGTTTATGGTGGTGGCCAGGGCCCTTGTCAC 
CCTTGTGCATTTTTTCGTGGGAGGCCCAGGTTAGCCTCGCCATCAGCATGATGAACTCCTC 

25 

SEQ ID 50 >gil5037688jgb|AI720432. JIAI720432 as8IfD9.xl Barsiead colon HPLRB7 Homo 
sapiens cDNA clone 1MAGE:2335 145 3' similar lo gb:X06233 CALGRANULIN B 
(HUMAN):, mRNA sequence 

GGAGGAAGAGACTTTATTTGGCCCCAGCCCCTAGCCCCACAGCCAAGACAGTTTGACATAA 
30 CAGGCCCCGGGGCCCTGGTTGGGTAGAGGCAGGGTGGCCTGGCCTCCTGATTAGTGGCTGT 
GGCCGTGGCCACCATGACTGTGGCCGTGGCCGTGGCCACTGTGATCTTGGCCACTGTGGTC 
TTAGGGGGTGCCCTCCCCGAGGCCTGGCTTATGGTGGTGGCCAGGGCCCTCGTCACCCTCG 
TGCATTTTCTCGTGGGAGGCCCAGGTTAGCCTCGCCATCAGCATGATGAACTCCTCGAAGCT 
CAGCTGCTTGTCTGCATTTGTGTCCAGGTCCrrCCATGATGTGTTCTATGACCTTTTCATTCTT 
35 ATTCTCCTTCTTGAGAAAATTTTGCAGATCrrTTTCGCACCAGCrCTTTGAATTCCCCCrGGTT 
CAGGGTGTCTGGGTGCCCCA 

SEQ ID 5I>gill88689|gb|M21064.11HUMMRP14A Human migration inhibitory factor-related 
protein 14 (MRP14) gene, complete cds 

40 ATCACTGTGGAGTAGGGGAAGGGCACTCCTGGGGTGGCAAGGTGGGAGGTGGGCCCTGTG 
TTCCCACAGTGGGCAGGGAGGTAGTGAAAGGGAAGCTGGCCGGACAGGAAGGGCCATTCC 
AAGAGGGCTTrGTGCGCAGGGCTAAGCCAAGCTTTCTCCATAGGCAATGGGGAGCAACTGG 
AGGTTCGTAGCAGGAGAAGGACACATCAAGCCCACCAGGAGGCTAAGTAAAAACAGTTGT 
CTCCCAAGTTATAAGTTCCTGGAACCCTTGCTGGGAGCAGGATTTAGAAAAATGATG(rrGA 

45 GAGATGCTAGAAACATATTCGCCCTGAGGCTCTCTCACTCAGACTGCAAGAGGAAGGTATC 
ATCAGAATTGCCCTTAACCAGGAACCAGAATAGCTGGGTCCCCTTCCTGCCAAGTCAGCAA 
CCAGCTATGTGACCTTGCTCAGGTCCATCrrCCGGGTGTCAGTTTCTTCATCTACAATGCAAG 
AGGGTTGCCCACCTCTGAGAACCCTTCrrAACCCCAAATCTCACCCrrATGAATCTAAGAACA 
CAACCCCTCGCCATCCTAAGTATCACAGAGCCAGGCAAGCATGGGTGAGAGCTCAGACCAT 

50 CCTTGTTGGACTAAAAGGAAGGGGCAGACTGCCATGGGGGGCAGCCGAGAGGGTCAGGCC 
CCCATAGGTCCTCAGCCTGCTTCAACCTCAAAGGGGATGGGGGGCTGAGTGGTGCCAGAGG 
AGCAGCAGGCTCGCTCGGGGAGAGTAGGGCCrrTAGGATAGAAGGGAAATGAACTAAACAA 
CCAGCTTCCTGCAAACCAGTTTCAGGCCAGGGCTGGGAATTTCACAAAAAAGCAGAAGGCG 
CTCrrGTGAACATTTCCTGCCCCGCCCCAGCCCCCTTCCTGGCAGCATTAGCACACn'GCTCAC 
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CTGTGAAGCAATCTTCCGGAGACAGGGCCAAAGGGCAAGTGCCCCAGTCAGGAGCTGCCTA 
TAAATGCCGAGCCTGCACAGCTCTGGCAAACACTCTGTGTGGCTCCTCGGCTTTGGTAAGT 
GAGCTGCCAGCTTCCCCAGGCAGAAGCCTGCCTGCCGATTCCTTCTTTCCTTCCCTGACCCA 
ACTTCCTTCCAAATCCTCCTCCTAGAAGCCCTCCTTGGTTGGCCCTGCCTACTTTAAAGCTT 
5 CriTCACATTTTCTTAGGTCATGTTCCCCTGGGGCCTCCTGCCCTCAAATGCnTTGC^^ 

GCACTCTGTAGATATTCTAAAAAATCATTTTGTACATGTGTGTGACAGGCCATCTCCCAGTT 
AAGTTGCAGCCTGTGCTTTCTTTTTATTTTGCACTTCCCCCACTATTTCTGTGAGTGCTTAGT 
AGGAAGTGTCAAAGAAGCTTGACAGCATTTTCTTCTAAGTGTCCCAACTCTTGGTTTTCCAT 
TACACAGACAGAGTGCAAGACGATGACTTGCAAAATGTCGCAGCTGGAACGCAACATAGA 

10 GACCATCATCAACACCTTCCACCAATACTCTGTGAAGCTGGGGCACCCAGACACCCTGAAC 
CAGGGGGAATTCAAAGAGCTGGTGCGAAAAGATCTGCAAAATTTTCTCAAGGTAGGGCTGG 
ACTCTGGCAGGTCTGACCCAGCCTCACCGCAGTTTGGGTTGACAAGGGAGGATGGGAGTAT 
GGGCTACAGCAATCAAGGGGAAGATTTGAGCTCCTGGAGCCCAGCCCCAAGACGCAGCGA 
GTGTCCTGTTATACAGGGCAGGTGCTCACAGTTACACAGGACGACAGGGTCAAGAAATTGC 

15 TCAATTGAACACCTGCTATTTGTCGGGCCCTGTTCTGGGCAGAGGGATGTAGTGGTAAATG 
GGAGCCCACTATTCCATGAGGAGACACACAGTAAAGTTGTTGGCCAATAAAGAGCACAGAT 
AAAGCCAAATGCCAATAAGTGCCTGGAAGAAAATGAGATAGAGTGCGCTGTGGGCAATGG 
GGCTGGGTGGGGTGGAGGTGACCAGTTAGGGTACATGAGAAGGGCCTCTTTGAGGAGGTA 
ACATTTGAGCTGAGCCCCGAATGTTGGGGAGGGAAGCCCCTGAGGATGACACTTGGCACAA 

20 AGCTGAGGAGACCCTAAGCCTCAGGGCGAACTTGGGGTGGAAGACTTGGGGGCTTTTCTAA 
TCCTAAGGGTCTGCGGTGGAAAATGAATGCATAAAGAGCACATGGAGAGCACCTGCACAG 
CACTCAGGGAACTGGGAGGTTTTTCCCCCGCTCCAAAAATGATTAGGCAGTTCTAAGAAAA 
AGGCTGAGCACTTCCAACAGCCTTTTTGrrrrC l"l I"! CAAATTTGGGGAAAGTCGGGAAACA 
GAGGCCTGCATTAAGAAGGGTGGAACACATGGGTCTCAGTCTCAGTTCCAGTCCCGGAGCC 

25 AGACATCCTGGGGTAGGTCCCCAGCCCTCCCAGTGCCCCTCCCTCCGCCTTGGTAAGGTGG 
AGAATTGCAGCCTTCAGAGTTAGGGGCCCTGACAGCTCTCCATAGGTGGAGGCCTCAGGCA 
GGCAGGATGCTGGGTGGGGTAGGCAAGAAAGGGCCCAGCAGAGAGGCCGCATCGGAAAAC 
TATCCTCCATGTGACCCCCTATGCCCGCTTCACCCCCCACCTGACATCCCCCACCAGAAGCA 
AAGCGATGCTGTGGGAAAGGAAGCAGAGCCTCATGGATGGGCTGCACAGGAGAGTGCTCG 

30 CATTGGCTGGGTACCCCACAGGTTCTGGGAGGGGACTTAGCGAGGTGACTCAGTGCCTCGG 
CCTCCCAAAGTGCTGGGATTACAAGCATGAGCCACCCTGTCCGACCATCTCCCCTTTTATAC 
TTTATCACACCCTTGAGGTCAGCGGAGCACATACTCTGCTCTCTGACCCTCCATCTCCCCTG 
CCCACACCTAGGTTTTTCTAGTGTTTCCCCGTTGTATTGGTTGAAATAAGTTTCACTAATTG 
GTAACCTCCAGAGGGAAGGGAAGGGAGGGCAGGGGAAGGAGTGAAGTGCAGAGGGGTAG 

35 CAGAGTGGAACTGGCCTCTAAGTCAGATCTGAATTTGCATGCCCTCAATAGTCAAGCCTGT 
GAAAACTAATGACCCTCTCTAGGACTGGTTTCAAGTCTTCCTCCAGGAAGATACCATTCCTA 
GCTGTTAAAGTTGTTATAAGGACCAAATGAGGTGACATTTCCAGGCTTACTCATGCCATGA 
CCAGGGCAAGACCCTGGAACTCAGCTTCCTCTTCTATAAATAGAGAATCAGCACCCAAGTC 
ACAGGGTCATGGAGGGAATAAACTGGAGAGCGTTTGGTATGTGCTCAGTGTCTGCTCCATT 

40 GTGCGCACTCAGCCTATGGTCATTTTTAATTrTTAAATCCAGCCCCAGGGTCGAGGCTTCCT 
TGTACATTTGCCAGCTGGTCATTTACTGTGCTCCCAGTCCCCACCTCTGGCCACACCCAGCT 
CTCACAGCCTTCTCTCCCCACCCGCAGAAGGAGAATAAGAATGAAAAGGTCATAGAACACA 
TCATGGAGGACCTGGACACAAATGCAGACAAGCAGCTGAGCTTCGAGGAGTTCATCATGCT 
GATGGCGAGGCTAACCTGGGCCTCCCACGAGAAGATGCACGAGGGTGACGAGGGCCCTGG 

45 CCACCACCATAAGCCAGGCCTCGGGGAGGGCACCCCCTAAGACCACAGTGGCCAAGATCA 
CAGTGGCCACGGCCACGGCCACAGTCATGGTGGCCACGGCCACAGGCCACTAATCAGGAG 
GCCAGGCCACCCTGCCTCTACCCAACCAGGGCCCCGGGGCTGTTATGTCAAACTGTCTTGG 
CTGTGGGGCTAGGGGCTGGGGCAAATAAGTCTCTTCCTCCAAGTCAGTGCTCTGTGTGCTTC 
TTCCACCTCTTCTCCAACCCTGCCTTCCCAGGGCTCTGGCATTTAGACAGCCCTGTCCTTAT 

50 CTGTGACTCAGCCCCCTCATTCAGTATTAACAAAATGAGAAGCAGCAAAACATGGGTCTGT 
GCTGGGCCCCTTGGCTCACCTCCCTGACCATGTCCTCACCTCTGACTTCAGGCCCCACTGTT 
CAGATCCCAGGCTCCCTGCCCCATCTCAGACACCCTGTCCAGCCTGTCCAGCCTGACAAAT 
GGCCCTTGTCACTGTACACTGTAGAAAGCAAAAAGGCATATCTCTACCCCTTGATATGCCT 
GCTACCTCACCAACCAGCCCCAAGCCTGTCTTCACCCATCACTGTCTACACAGCCCTCTCTC 
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TCTCCTAACAGAATTCTATTCCTCTGAAAGTCTTCAGAAACTGGACCTAGATAGTGCCATGT 
CTGGGGAGGAATATGGCACCAGGCAGTGGAAACAAGGACAGATCGGTGTGTTATCTCACAT 
TTGATCAGAGAGCATGATCTCTCTTAACAGACCTGCCACCCTAATCAACGGGAGTGCTCAC 
ACAAGTGGGAGTCTGAGAGCTTAGCCCTATGCCCACCCTGG 

5 

SEQ ID 52>gi|4506772|reflNM_002965J|S100A9| Homo sapiens S 100 calcium-binding protein 
A9 (calgranulin B) (S100A9) inRNA 

AATTCGCTCGGCTTTGACAGAGTGCAAGACGATGACTTGCAAAATGTCGCAGCTGGAACGC 
AACATAGAGACCATCATCAACACCTTCCACCAATACTCTGTGAAGCTGGGGCACCCAGACA 

10 CCCTGAACCAGGGGGAATTCAAAGAGCTGGTGCGAAAAGATCTGCAAAATTTTCTCAAGAA 
GGAGAATAAGAATGAAAAGGTCATAGAACACATCATGGAGGACCTGGACACAAATGCAGA 
CAAGCAGCTGAGCTTCGAGGAGTTCATCATGCTGATGGCGAGGCTAACCTGGGCCTCCCAC 
GAGAAGATGCACGAGGGTGACGAGGGCCCTGGCCACCACCATAAGCCAGGCCTCGGGGAG 
GGCACCCCCTAAGACCACAGTGGCCAAGATCACAGTGGCCACGGCCATGGCCACAGTCATG 

15 GTGGCCACGGCCACAGGCCACTAATCAGGAGGCCAGGCCACCCTGCCTCTACCCAACCAGG 
GCCCCGGGGCCTGTTATGTCAAACTGTCTTGGCTGTGGGGCTAGGGGCTGGGGCCAAATAA 
AGTCTCTTCCTCCAAGCT 

SEQ ID N°53 > NAME = "Reverse-Translalion of SAP B FR* : TYPE = DNA 
20 GAYAAYGGNGAYGTNTGYCARGAYTGYATHCARATGGTNACNGAYATHCARACNGCNGTN 
MGNACNAAYWSNACNTTYGTNCARGCNYTNGTNGARCAYGTNAARGARGARTGYGAYMG 
NYTNGGNCCNGGNATGGCNGAYATHTGYAARAAYTAYATHWSNCARTAYWSNGARATHGC 
NATHCARATGATGATGCAYATGCARGAYCARCARCCNAARGARATHTGYGCNYTNGTNGGN 
TTYTGYGAYGARGTN 

25 

SEQ ID N*' 54>gii337755jgblJ03O15.1|HUMSAP Homo sapiens sphingoiipid activator protein 1 
mRNA, 3' end 

CGCGCTATGTACGCCCTCTTCCTCCTGGCCAGCCTCCTGGGCGCGGCTCTAGCCGGCCCGGT 
CCTTGGACTGAAAGAATGCACCAGGGGCTCGGCAGTGTGGTGCCAGAATGTGAAGACGGC 

30 GTCCGACTGCGGGGCAGTGAAGCACTGCCTGCAGACCGTTTGGAACAAGCCAACAGTGAA 
ATCCCITCCCTGCGACATATGCAAAGACGTTGTCACCGCAGCTGGTGATATGCTGAAGGAC 
AATGCCACTGAGGAGGAGATCCTTGTTrACTTGGAGAAGACCTGTGACTGGCTTCCGAAAC 
CGAACATGTCTGCTTCATGCAAGGAGATAGTGGACTCCTACCTCCCTGTCATCCTGGACATC 
ATTAAAGGAGAAATGAGCCGTCCTGGGGAGGTGTGCTCTGCTCTCAACCTCTGCGAGTCTC 

35 TCCAGAAGCACCTAGCAGAGCTGAATCACCAGAAGCAGCTGGAGTCCAATAAGATCCCAG 
AGCTGGACATGACTGAGGTGGTGGCCCCCTTCATGGCCAACATCCCTCTCCTCCTCTACCCT 
CAGGACGGCCCCCGCAGCAAGCCCCAGCCAAAGGATAATGGGGACGTTTGCCAGGACTGC 
ATTCAGATGGTGACTGACATCCAGACTGCTGTACGGACCAACTCCACCTTTGTCCAGGCCTT 
GGTGGAACATGTCAAGGAGGAGTGTGACCGCCTGGGCCCTGGCATGGCCGACATATGCAA 

40 GAACTATATCAGCCAGTATTCTGAAATTGCTATCCAGATGATGATGCACATGCAACCCAAG 
GAGATCTGTGCGCTGGTTGGGTTCTGTGATGAGGTGAAAGAGATGCCCATGCAGACTCTGG 
TCCCCGCCAAAGTGGCCTCCAAGAATGTCATCCCTGCCCTGGAACTGGTGGAGCCCATTAA 
GAAGCACGAGGTCCCAGCAAAGTCTGATGTTTACTGTGAGGTGTGTGAATTCCTGGTGAAG 
GAGGTGACCAAGCTGATTGACAACAACAAGACTGAGAAAGAAATACTCGACGCTTTTGAC 

45 AAAATGTGCTCGAAGCTGCCGAAGTCCCTGTCGGAAGAGTGCCAGGAGGTGGTGGACACGT 
ACGGCAGCTCCATCCTGTCCATCCTGCTGGAGGAGGTCAGCCCTGAGCTGGTGTGCAGCAT 
GCTGCACCTCTGCTCTGGCACGCGGCTGCCTGCACTGACCGTTCACGTGACTCAGCCAAAG 
GACGGTGGCTTCTGCGAAGTGTGCAAGAAGCTGGTGGGTTATTTGGATCGCAACCTGGAGA 
AAAACAGCACCAAGCAGGAGATCCTGGCTGCTCTTGAGAAAGGCTGCAGCTTCCTGCCAGA 

50 CCCTTACCAGAAGCAGTGTGATCAGnTGTGGCAGAGTACGAGCCCGTGCTGATCGAGATC 
CTGGTGGAGGTGATGGATCCTTCCTTCGTGTGCTTGAAAATTGGAGCCTGCCCCTCGGCCCA 
TAAGCCCTTGTTGGGAACTGAGAAGTGTATATGGGGCCCAAGCTACTGGTGCCAGAACACA 
GAGACAGCAGCCCAGTGCAATGCTGTCGAGCATTGCAAACGCCATGTGTGGAACTAGGAG 
GAGGAATATTCCATCTTGGCAGAAACCACAGCATTGGTTrrrTTCTACTTGTGTGTCTGGGG 
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GAATGAACGCACAGATCTGTTTGACTTTGTTATAAAAATAGGGCTCCCCCACCTCCCCCATT 
TCTGTGTCCTTTATTGTAGCATTGCTGTCTGCAAGGGAGCCCCTAGCCCCTGGCAGACATAG 
CTGCTTCAGTGCCCCTTTTCTCrCTGCTAGATGGATGTTGATGCACTGGAGGTCTTTTAGCC 
TGCCCTTGCATGGCGCCTGCTGGAGGAGGAGAGAGCTCTGCTGGCATGAGCCACAGTTTCT 
5 TGACTGGAGGCCATCAACCCTCTTGGTTGAGGCCTTGTTCTGAGCCCTGACATGTGCTTGGG 
CACTGGTGGGCCTGGGCTTCTGAGGTGGCCTCCTGCCCTGATCAGGGACCCTCCCCGCTTTC 
CTGGGCCTCTCAGTTGAACCAAAGCAGCAAAACAAAGGCAGTTTTATATGAAAGATTAGAA 
GCCTGGAATAATCAGGCTTTTTAAATGATGTAATTCCCACTGTAATAGCATAGGGATTTTGG 
AAGCAGCTGCTGGTGGCTTGGGACATCAGTGGGGCCAAGGGTTCTCTGTCCCTGGTTCAAC 

10 TGTGATTTGGCTTTCCCGTGTCTTTCCTGGTGATGCCTTGTTTGGGGTTCTGTGGGTTTGGGT 
GGGAAGAGGGCCCATCTGCCTGAATGTAACCTGCTAGCTCTCCGAAGCCCTGCGGGCCTGG 
CTTGTGTGAGCGTGTGGACAGTGGTGGCCGCGCTGTGCCTGCTCGTGTTGCCTACATGTCCC 
TGGCTGTTGAGGCGCTGCTrCAGCCTGCACCCCTCCCTTTGTCTCATAGATGCTCCTTTTGA 
CCTTTTCAAATAAATATGGATGGCAAGCTCCTAGGCCTCTGCTTCCTGGTAGAGGGCGGCA 

15 TGCCGAAGGGTCTGCTGGGTGTGGATTGGATGCTGGGGTGTGGGGGTTGGAAGCTGTCTGT 
GGCCCACTTGGGCACCCACGCTTCTGTCCACTTCTGGTTGCCAGGAGACAGCAAGCAAAGC 
CAGCAGGACATGAAGTTGCTATTAAATTGACTTCGTGATTTTTGTTTTGCACTAAAGTTTCT 
GTGATTTAACAATAAAATTCTGTTAGCCAG 

20 SEQ ID 55 >gi)337761igb]M32221 .1)HUMSAPABCD Human saposin proteins A-D mRNA, 
complete cds 

CGCGCTATGTACGCCCTCTTCCTCCTGGCCAGCCTCCTGGGCGCGGCTCTAGCCGGCCCGGT 

CCTTGGACTGAAAGAATGCACCAGGGGCTCGGCAGTGTGGTGCCAGAATGTGAAGACGGC 

GTCCGACTGCGGGGCAGTGAAGCACTGCCTGCAGACCGTTTGGAACAAGCCAACAGTGAA 

25 ATCCCTTCCCTGCGACATATGCAAAGACGTTGTCACCGCAGCTGGTGATATGCTGAAGGAC 
AATGCCACTGAGGAGGAGATCCTTGTTTACTTGGAGAAGACCTGTGACTGGCTTCCGAAAC 
CGAACATGTCTGCTTCATGCAAGGAGATAGTGGACTCCTACCTCCCTGTCATCCTGGACATC 
ATTAAAGGAGAAATGAGCCGTCCTGGGGAGGTGTGCTCTGCTCTCAACCTCTGCGAGTCTC 
TCCAGAAGCACCTAGCAGAGCTGAATCACCAGAAGCAGCTGGAGTCCAATAAGATCCCAG 

30 AGCTGGACATGACTGAGGTGGTGGCCCCCTTCATGGCCAACATCCCTCTCCTCCTCTACCCT 
CAGGACGGCCCCCGCAGCAAGCCCCAGCCAAAGGATAATGGGGACGTTTGCCAGGACTGC 
ATTCAGATGGTGACTGACATCCAGACTGCTGTACGGACCAACTCCACCTTTGTCCAGGCCTT 
GGTGGAACATGTCAAGGAGGAGTGTGACCGCCTGGGCCCTGGCATGGCCGACATATGCAA 
GAACTATATCAGCCAGTATTCTGAAATTGCTATCCAGATGATGATGCACATGCAACCCAAG 

35 GAGATCTGTGCGCTGGTTGGGTTCTGTGATGAGGTGAAAGAGATGCCCATGCAGACTCTGG 
TCCCCGCCAAAGTGGCCTCCAAGAATGTCATCCCTGCCCTGGAACTGGTGGAGCCCATTAA 
GAAGCACGAGGTCCCAGCAAAGTCTGATGTTTACTGTGAGGTGTGTGAATTCC TGGTG AAG 
GAGGTGACCAAGCTGATTGACAACAACAAGACTGAGAAAGAAATACTCGACGCTTTTGAC 
AAAATGTGCTCGAAGCTGCCGAAGTCCCTGTCGGAAGAGTGCCAGGAGGTGGTGGACACGT 

40 ACGGCAGCTCCATCCTGTCCATCCTGCTGGAGGAGGTCAGCCCTGAGCTGGTGTGCAGCAT 
GCTGCACCTCTGCTCTGGCACGCGGCTGCCTGCACTGACCGTTCACGTGACTCAGCCAAAG 
GACGGTGGCTTCTGCGAAGTGTGCAAGAAGCTGGTGGGTTATTTGGATCGCAACCTGGAGA 
AAAACAGCACCAAGCAGGAGATCCTGGCTGCTCTTGAGAAAGGCTGCAGCTTCCTGCCAGA 
CCCTTACCAGAAGCAGTGTGATCAGTTTGTGGCAGAGTACGAGCCCGTGCTGATCGAGATC 

45 CTGGTGGAGGTGATGGATCCTTCCTTCGTGTGCTTGAAAATTGGAGCCTGCCCCTCGGCCCA 
TAAGCCCTTGTTGGGAACTGAGAAGTGTATATGGGGCCCAAGCTACTGGTGCCAGAACACA 
GAGACAGCAGCCCAGTGCAATGCTGTCGAGCATTGCAAACGCCATGTGTGGAACTAGGAG 
GAGGAATATTCCATCTTGGCAGAAACCACAGCATTGGTTTTTTTCTACTTGTGTGTCTGGGG 
GAATGAACGCACAGATCTGTTTGACTTTGTTATAAAAATAGGGCTCCCCCACCTCCCCCATT 

50 TCTGTGTCCTTTATTGTAGCATTGCTGTCTGCAAGGGAGCCCCTAGCCCCTGGCAGACATAG 
CTGCTTCAGTGCCCCTTTTCTCTCTGCTAGATGGATGTTGATGCACTGGAGGTCTTTTAGCC 
TGCCCTTGCATGGCGCCTGCTGGAGGAGGAGAGAGCTCTGCTGGCATGAGCCACAGTTTCT 
TGACTGGAGGCCATCAACCCTCTTGGTTGAGGCCTTGTTCTGAGCCCTGACATGTGCTTGGG 
CACTGGTGGGCCTGGGCTTCTGAGGTGGCCTCCTGCCCTGATCAGGGACCCTCCCCGCTTTC 
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CTGGGCCTCTCAGTTGAACCAAAGCAGCAAAACAAAGGCAGTTTTATATGAAAGATTAGAA 
GCCTGGAATAATCAGGCTTTTTAAATGATGTAATTCCCACTGTAATAGCATAGGGATTTTGG 
AAGCAGCTGCTGGTGGCTTGGGACATCAGTG 

5 SEQ ID N° 56>gi|3451333|gb|ACO05525.1|ACO05525 Homo sapiens chromosome 19. cosmid F22162, 
complete sequence Perlecan 

GATCTTGGCTCACTGCAACCTCCGCCTCCAAGGTTCAAGCGATCCTCCCACCTCAGCCTCCC 
AAGTAGCTGGGATrACAAGCGTGTGCTATCACACCTGGCTAATTTTTATATTTTTGGTAGAG 
ATGGGGTTTCACCTTGTTGGTTAGGCTGGTCTTGAACTCCTGACCTCAGGTGATCTGCCTGC 

10 CTCAGCCTCCCAAAGTGCTGGGATTACAGGTGTGAGCCACCGCGCCCAGCCTGACCCTTTC 
TTTCTCTACTGGCAAAACTCCTGCTCCTTTTTAAAGCCAAGCTCATGTCACCTCCTCTGTGA 
AGTCCTCGCTGACTCCCCAAGCGGTCAGTGTCTCTCTCGTATGGGCTCCCCGGCCCCTGCAC 
TGCTCTCCATCACACCCTGACCACTCTGGGCAGTGGCCCCCCTCCCCACCCACTGACTATGG 
GCTCCTTGAAGGCAGGGCCTGGGTCTGCCCCATCTCTGTGTCCCCAGCAATGCTGGGCATG 

15 AGTCAGCCTCAGAAGACATCTGCTGAATGGCTGCAAACCAGAGGAAATATCTCCAGCCTCA 
GGCTGGGACCCCTCCCCTCTCTCCTCCCACCTCTGACTTCATACCACTCACCCTCCAGAGTC 
TTCAATGCCCACTATTACTTCACACAGTTGGCCTGTGACAGGCAATCAGGTCATCGTCCACG 
GCTACCAGGTGTTTCATGTCTACTGTGACTTCCAGGACCACAAGCCCTTTTGCGCCCACCAT 
GTCTTCACCTAAGAGATCTTCAAAGCCCAGTATGTCTCTGGCACCCAGTGGATCCTCCATGC 

20 CCACTGCGGATCCCAAGCCTCCTGCCTCCTTGAAGTCCACCAAATCAGCAACACCCAACAG 
ATCCTTAGTGCCCACCAAACCAGCGACATCCCGTAACTCAGTCATGAGCCCAAGCAGTTCC 
AAGTCCACCAAATCGACCAGTACAAAAAGAGCCCCTTCTAACCGGCCCAGCAGCAGGTCCC 
GAGTCCGCAGCAAAGCAAGAACACCCAGCAGGGTGAGCACCGACACCAGGACCAGCAAAG 
CCAGCAAGGCCAGCGACGTGAGATGCCACCAGCGGAGGGGCACACACAGCCGGGGTAGGA 

25 CACCTGGCAGAAGGGGAAGCCGCAGCTCCAAGAGGTCACCCAGCAGGGCCAGCACTCCTG 
GCAGGATAAGAACTCATGGTGCCAGACCAGGCATGGCCAGCAGGGTGAGAACTCCCACTTC 
ACAGCAAAAAGGGAGCCGGGGAAAGAGTTACGGCCGGCCTAGAACCAGCAACAGGGAAA 
GGAGTGACAGCCAGCCTAGAAATCTGAGCAAGAAGAGTTACCGCCCACCAGGAGGCTCAG 
GTATAGGGAGGAGTTCCGAGCTGGCTGTAACTCCCAGTACAGCCAAGTGTCAAACCCCGAC 

30 TGGAATTCCCTCCAAGGAGAAGAGTGACAACCCATCTCCATCCTCATCAAGGAAGGTGAAG 
AGCTACGGTCAGATGATCATCCCCAGTAGGGAAAAGAGTTACAGCCCCACTGAAATGTCCA 
GCAGGGTCAAGAGTTATAACCAGGCCAGCACCCGCAGCAGGCCGCAAAGTCACAGCCAAT 
CTAGAAGCCCCAGAAGGTCAAGAAGTGGCAGTCAGAAGAGGACGCACAGCAGAGTGAGAA 
GTCACAGTTGGAAGAGAAACCATAGCAGGGCAAGAAGTCGCACCCGGAAGGGAATTCTGA 

35 GCCAGATGGGAAGACACACCCAGTCTAGAAGCCACAGCAAGGGGAAAAGTCAAAACCAAT 
CTAGAACCCCCAGAAGAGGAAGAAGTCACAACTGGTCTAGAAACCCCAGCAAGGAAAGAA 
GTCATAGCCATTCCAGAAGCTCCAGCAAAGAGAGAGATCACAGGGGATCTAGCAGCCCCA 
GGAAGGAGAGTGGTCGCAGTCAATCAGGAAGCCCCAACAAGCAGAGAGATCACAGCCGAT 
CTAGAAGTCCCAACAAGGCGAGAGATCGCAGCCGATCTAGAAGTCCCTACAAGGCGAGAG 

40 ATCGCAGCCGATCTAGAAGTCCCAACAAGGCGAGAGATTGCAGCCGATCTAGAAGTCCCTA 
CAAGGCGAGAGATCGCAGCCGATCTAGAAGTCCCAACAAGGCAAGAGATCATAGCCGATC 
TAGAAGTCCCAACAAGGCGAGAGATCGCAGCCGATCTAGAAGCCCCAGCAAGGAAAGAGA 
TCACAGCCAACTTGGAAGCCCCAGCAAAGAGAGAGATCACAGACGATCTAGAAGCCCCAG 
CAAGGAGAGACAGTGCAGACAATCTAGAAGCTCCAGCAAAGAGAGAGATCACAGACGATC 

45 TAGAAGCCCCAGCAAGGAGAGACAGCGCAGACAATCTAGAAGCCCCAACAAGGAGAGAGA 
TCGCAGCCAATCTAGAAGCCCCAGCGAGGAGAGAGAGCACAGACAATCCAGAAGCCCCAG 
CAAAGAGAGAGATCGCAGACGATGGAGAAGCCCCAGCAAGGAGAGAGAGCGCAGACAAT 
CTAGAAGCTCCAGCGAGGAGAGAGATCACAGCCGATCTAGAAGCCCCAATAAGCAGAGTG 
GTTACAGTCGACCTAGAGCCTCCAGCAAGGAGAAAGCTCATAGCCGATCTAGAACCCCCAG 

50 CAAAGAAGGAAATCATAGCCAATCTAGAACCTCTAGCAAGGAGAGCGACCCCAGTCAATC 
TACAGTCCCCAGAAGTCCCGACTGGAAGAGATCCCCTACTAGGACAAGCAGTCTCAGTCAG 
AATAGAACCCCTAGCAAGACAAGCAGCCACTCCCCATCAACATTTCCCAGTGGGGGCCAAA 
CCCTAAGCCAGGATGACAGTCAAGCCGACGCCACCACCTCTAAGGCCACCTTACCTGGGGA 
AAGGTCTTCATCATCTTCTTCCAAGCTGGCGTAGCCCCCAGTCTCAGCTGGCTCACGGGTCT 



103 



CTGTCATGACCGGGGGAGGGGACAGGAGACAGGAGCAGAGCAGCAGCTGAGCAGCGTCCC 
TCCCCGGCCAGCTCTCCACAGCCACACCTCCGGCCACAAGTTCTCTAATACAGGATGTTGG 
CAGGTAGAGAGGGATGCTGGATAGGGGGAAAGGAAAGACCTGTGATGATTCAATAAATTT 
TTACATAGCACCCATCCCCACCAAGCCCAACTGTGTGCTCACTGCTGGCATGGGGCACAGA 
5 GGACCCCAGCTCTGTCCCTGACTGTCTACAGGGTCTTGACTGCAAGCCCTGCCCCTCTCTAG 
GTCTTTTTTTTTTTTGAGACAGAGTCTCTCTCTGTTGCCCAGGCTGGAGTGCAGTGGTGTGA 
TCTCAGCTCACTGCAACCTCCACCTCCCAGGCTCAAGCAATTCTCCTACCTCAGCTTCCCGA 
GTAGCTGGAACTACAAGTGTGCGTCCTCACGCCCGGCTAATTTrGTATTTTTAGTAGAGATG 
GGGCTTCACCATGTTGGCCAGGCTGGGCTCGAACTCCTGACCTCAGGTGATCCACATGCCT 

10 CAACCTCGCAAAGTGCTGGGATTATAGGCATGAG 

CCACCGCACCCGTCCCCCTCTCTAGGTCTTAATTTCCGCATGTGGGCAACAAGGCTGCCTTC 
TGGTTCTTATTCAGTGGGGTAGGGAGAGGTGACACTCCAAATATTCAACAGTGGGGACTGG 
TGTGGGCACCAATCAGAACTGAGAGTGGAGCGGGACGGATACCAGGCCTTAACCCTTTAGT 
TGCTGGACCATGGGGAGGTCTGGGGTTGGGGAAGTGTTATGGGGAAAAAAAACCCTCAAA 

15 CTGTGTTTTTCCTCTACTCTCACACTATCACAACAATCATCAACACAGAATTCTGTGACCAA 
ATGTGTGGGGCTTTTTCCCCACACACTACACAGCAGACAACAGCTAGGTGTCCCCTCCGATT 
CCATTCCAACGCTGTCCCCACACCCAGCTAATTTTTGTATTTTTGGAAGAGACAGGGTTTCA 
CCATGTTGCCCAGAGCTCAAGCAATCTGCCCACTTCAGCCCTCCAAAGTGCTGGGATTACA 
GGCGTGAGCCACCACACCCGACTTTTTTAAAAAAATAAAAATAAGGCCGGGCGCAGTGACC 

20 CATGCCTGTAATCCCAGCACTTTGGGAGGCCGAGGTGGGCAGATCACCTGAGCTCAGGAGT 
TTGACACCAGCCTAGGCAACATGGCAAACTTGTCTCTAAAAAAAAAAAAAAAATTACAAA 
AGTTAGCCGGTGTGGTGGCATGTGCTTATAGTCCCAGCTACCTGAGAGGCTGAGGCAGGAG 
GATAAATTGAGCCTGGAAGGTCAAGGCTGCAGTGAGCCGTGACCTTGCCACTGCACTCAAG 
CCTGGATGACCCATCTTACAAAAAAAAAATTTTTGCTGGAGCTGCTCACAGAACTCAAGGA 

25 AATGCTTACTTAGATTTACTGGTTTATTATAGAGGATATTGCAAAGAACAAAGATGAAGAG 
ATGTGTAGGGCAAGGTATAAGGGAAGGGGCAGGGAGCTTCACGCCCTCCCTGGGGTGCTAC 
CCTACAGGAACCCTCAGGTGGTTAGCTATGCGGAAGCTCTCCAAACCCAGTCCTCTTGGGT 
TTTTACGGAGGCTTTAAGACAGCAGCATTGGGCATGGACTTCTCTGAAAAGTGTCTTAAGA 
CCAACAATCAAGAAGGTGGGGAAGATTAGAGTCTTGCCCTGGGGCAGGAAATGGAGGGCA 

30 GGAGGAGGTCAGAGAGATTCTGTTTCTTCAGACCTGCCCCAGGCCTAAGGTACACAACATT 
ATAACAAGAGACTGTAACAAAGGCTGTAGGAGTTACCAGCCAGGAACTGTGGATGAAAAC 
CAATATATTTATATATATAATACCACAAGGGGGGTCCAAAGTGGCAGTTAGGGACAGGGAG 
TACTTGTGTAGCAGTGACACACCAACCCATCTGGAAGTATTTTAATATTTAAACAATTGGTA 
TGGCTATACTAGTTTGTGATTATCAGCCTTAGTTCTGTATCAATTGGCAAGATAGTGTCTAG 

35 GTTTGCCACACTCTAGCTGTGTAGCACCAAGCAAAGAACTTAACTTCTCTAGCCTGTTTCCT 
TCTCTGGAAGAAAGGGGCTTCCAGGCCTTAACTCACGTACTCCCCATAACTAGACTGGGAA 
TTATCTCCTTTGTACAGATGAGGAAACAGACACAGAGGTGATAAGTGAGTAGCCCAAGGTC 
ACCATCTGGTAAGTGGATGAACTAGGATTGGAAGCCAGACCTTTCATAAAATGATTTCTCA 
GCTCAAAAGGTTTTTCTGAAGATTCAGTAGGCTCACTGATAGAAATTGCTGGTGTGTGGCT 

40 GGTATTCCATCAAGAGTGGCCATTACTACTCCCACCCCTGCCCCTCTATAAACTCCAGATGT 
TCCAGACCTCTCATCTCTCCCTGTGCACACAAGGCCTTTTCACATCTGTGGGTCTTAGTACA 
CCCACTGTTGCTGTCAAGAATGTCCTCCTCCTCCTTTTTTTTrrTTTTTTTGAGATGGAGTCT 
CACTTTGTTGCCCAGGCTGGAGTACAGTAGCGCGATCTCAGCTCACTGCAACCTCTACCCTG 
CATCAGCCTCCCTAGTAGCTGGGATTACAGGCAGCCACCACCACCATGCCCGGCTAATTTrr 

45 TGGTATTTTTAGTAGAGACAGGGTTTCATTATGTCAGCCAGGCTGGTCTCAAACTCCTGACC 
TCAGGTGATCCATTTACCTTGGCCTCCCAGAGTGCTGGGATTACAGGCAAGAGCCACCACG 
CCCAGCCCTCCTTCCCCCTTTTTGGCCTGGAGAACTCCTTTTCACCCTTCAAAGCCCACCAC 
AAACATAAGAACCTCTATACTTCTTGCCCGCTGAAATACTGCCTCTGCCAGGAAGCCTTCTG 
TGACTTCTCTCTCTCCCTCTTCACCAACGGACCGCCCCCGCCCCCCACCAACCCCACCACAC 

50 ACACACACCACTACTGTCTTCCACTGTACTCCCTGACAGTAGAGAACCAAGCAGGGCCAGT 
TGATGCAGCCTCAGCTATATCTCTTACATGCCAAGGCCCATGCACTGGGGATACAATGGTG 
GAAAATACATGGTCCCTTCAAAGTCTGGATGTCAAGTTTAATGCTGGGGACTAAAGAGAAA 
AGCTTCAGATTGAAACCTGGAGGTGGCTGGGGCAAAGGACCATTGGCATCATTGGCAGGGC 
AACTTCCTAAAGAAAGCACCTAAATCTTGGCTTTTAAAGACAGATTTCATAATTGGCAGAG 
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GAGAATTCTAATGATACCCTATTGCCTACAGGGCCCCATCTAATTTGGGAATTCTACTTTAT 
ACC AAGATA AGATTGCCAGATTTAGCAAATAAAAACAGAAGACATCCAATTAATri ITi'lG 
TTTGTTTTrGGGTTTTTGTTGCGGAGATGGTGTCTCACTATGTTGCGAAGGCTGCTGTCAAA 
TTCCTGGCTCAAACAATCCTCCTGCCTTGGCCTCCCACTTCCCAAAGTGCTGGGATTACAGG 
5 CATGAGCTACCACACCTGGCCCTTATTTATTrATTTATTTAATTTTCTTTTTTGGG^ 

GTCACTCTGTCGCCCAGGTTGGAGCGCAGTAGCGCGATCTCGGCTCACTGCAACCTCTGCCT 
CCTGGGTTCAAGCGATTATCCTGCCCCAGCCTCCCAAGTAGCTGGGACTACAGGCGCGTGC 
CACCATGCCCGGCJ I'l'l 1 11 ri'lTl 1 1 1 ri'l J ri ri ri l lGAGACGGAGTCTTGCTCTGTCGCC 
CAGGCTGGAGTGCAGTGGCACGATCTCGGCTCACTGCAAGCTCCGCCTCCTGGGTTCACGC 

10 CATTCTCCTGCCTCAGCCTTCCGAGTAGCTGGGACTACAGGCGCCTGCCACCACGCCCGACT 
ATTTTTTGTATTTTTAGTAGAGATGGGGTTTCACCGTGTTAGCCAGGATGATCTCGATCTCC 
TGACCTCGTGATCCACCCGCCTCGGCCTCCCAAAGTGCTGGGATTACAGGCGTGAGCCACC 
GCGCCCAGCCTACTTATTTATATTTTTTAAGAGACAGGGTCTCGCTCAGTTGCCCAGGCTGG 
AGTGCAGTAGGGTGATCTGTAGGAAAGGGGCTTCCAGGCCTTAACTCATGTACTCCCCCAT 

15 AACCAGGTTGGGAGGTTAGCTCACTGTAACCTCAAACTCCTGTGCTCAAGGTACCCTACTA 
GCCCCTAGGAGAGCAGCrGGGACTACAGGTATGCGCCACCATGCCAGGCTTAATTTTTACT 

iTrrri'rJ i Ti'i'i 1 1 n 1 1 1 ri gtagagacgggggtctcactatattgcccaggctggtcttg 
aactcctggtctcaagcgatcctcctgccttagcctcccaaagtattggtatcactgcaact 
agcccaaagaattaatatagctatgttccatgtgatatttgggacatacttttctaaaaggt 

20 tgtatcttttggatataattgtttatctgaaattcaaatttaactagacattgtatattttat 
acggcaaccacacacctgggacaatcaagacattccctgaagttaccaggagacaatgccc 
atcagcctacacttttccaagcccacgtcacacaaggccccttccagagtattccagacgtc 
aggtagggccatcccttggttcacaagtcccactcctaccacgcctatggcagccaaactg 
aaaggcaaacacagtgctggagaccccacaatgccctgggcctatagcagtcaattcccaa 

25 gatgccccgcgtgaacacaataggcacccgttccaatgctcgagcaaagagaccagggca 
aaaccttccactacgggacaataacggccagttcccacaattcgttgtggcagttcttccca 
ggatgccttaggcctatagcgaccaccttcccagactccccgtgtggaagcgctccaagcc 
tccaggacggtcagcggcaggtgtgggataaaaggaaccggtctcgacaaggatctggga 
cactctttcccaggatgcaccaggcctacgactagcggaccgactcccacagcgcttcaag 

30 gcggagcgctcggttctcccaggatgccccagggcggcacaaacgcgtagggggagaaaa 
agaagccctcgggtcaccacggccccagaccgccggctccccggtgacgggagtcgtcgct 
cccatcatgcagcggggccgtagcgcccgcttcccggcatgcctcgcgcacccctgcccgg 
gacactcaccggcgccggcggcccccgctccggctctgcggcggcggctgcacgcccagcc 
tctgcgcctgcgtcgcaagtagggtaggacagcgcgcagggggcgtgaagagcctagggc 

35 gcttgcgcggcgagacggactagtcctgtagcgctgtgggaagaggggctatgcgcgtcgg 
gccgtcgacgagacccgcgcggggggcgccgtgctttgcccctcgctgcctgggtttactt 
ggtacagcccgcggcccaaaggaacaagaagctgaagggttcgcgcgtgcgtgtgcgggg 
caggaacgcgccttacaaaactgggatgcgctgggggtggagggcgctagttcggactgg 
atcctgggcccgaggcctgcttatttgcataatcctagcgcgggacaatgaaaggcctccc 

40 gcactggaaggagtgatttgcatattccccggaggggccttactccagagcgcagtgatta 
gcatatggcgggggcaacctgagcaaagcgcatgcgcgcagggactgcagactgacgcga 
agtgggtagccttgtcttcgtaggggatcagtttgcatc 

ctgagagagggcacgagggccaggacccctcccaaccaggataaaggtttattgatctcct 
aggtgtcaggccccatgctggcggattctgtggtttctgcagtgaaccatactcctgtactc 

45 acggcaccccagtcgaaggagatacgcacctaattagacaactactacccagaaggtcag 
acctggagtgaggaacacagggggctgtgggagcctaagaggcgcttgccccggcctctg 
gttctagaaagacttccaggaggtggtgatccttaagccaagtacgaataggagccaacta 
gaatgggaatgggtctggcagaatgaactgcaagcgccaaggcccagaggccaaaaaaaa 
aaaaaaaaaaatagaagcgcatgttttgatrgaggaagcaagagcagcttagtatgccta 

50 gaacctaactggagacgggaaatggttctatagacgatgttagagttcaactatggctaca 
ttccagtcttcctgtaagtgactttgtcacattctggcttaaaactcccccaaagggatccc 
attaggaaaaaaaaaaaatccaaaaatctttatcatggcctcagggctatacacctggtct 
ggccgtgcttatctttctgaccccacctacttcctcctccctccatttctgtccagctccacc 
ttaccccaaactctttaccagctcgggcctctgctcttgccgttccctccgcctgaaaatgc 
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TIXrCCCTCTGACCTTTGAATACCTACTCTTGTGCTCACCATTCATATCTTGGTACAGATGTC 
AATCTGAGAGGCTTTTCCTGATCTCTCCATAATAGCACTTACACATTTGACTGGAGTTATGG 
ATAAATCGGGATTGGCCATGAGTTGGTGGTGGTTGTAACTGGCATGAAGAGTACATGGGGC 
TGGGCGCGGTGGCTCACGCCCGTAATCCCAGCACTTTGGGAGGCCGAGGCTGGTGTATCAC 
5 CTGAGGTCAGGAGCTTGAGACCAGCCTGGGCAACATGGTGAAACCCTGCCTCTATTAAAAC 
TACAAAAATTAGCCAGGGGTTATGGGGGGTGCCTGTAATCCTTGCTACTTGGGAGGCTGAG 
GCACGAAGATCACTTGAACCCTGGAGGCAGAGGTTGCATTGAGTCGAGATTGAGCCACTGC 
ACTCCAGCCTGGGCCACCCAGCGAGACTCTGGGTCTCGCCTGTAATCCCAGCACTTTGGGA 
GGCCGAGGCGGGCGGATCACGTCAGAAGATCGAGACCATCCTGGCCATCCTAGACCATTTC 

10 TACTAAAAATACAAAAAAAAAAAAAAAAAAATTAGCCGGGCGTGGTGGCAGGCGCCTGTA 
GTCCCAGCTACTCGGGAGGCTGAGGCAGGAGAATGGCGTGAACACGGGAGGCGGAGCTTG 
CAGTGATCCGAGATGGCGCTACTGCACTCCAGCCTGGGCGACAGAGCGAGACTTGGTCTCA 
AAAAAAAGAGTACATGGGACGTTATTGTCCTGTCTACTCCTGTGGGTTTGAAGTTTTCCATA 
ATGACAATGGCATACCACATCACCATACTCTGCATTTATATTAATAGTTCTTATCACAATCT 

15 GAACTTTCTTTGCTTCCrrGTTTTGAGTGTTTTCCTCATGAAAGCTTCATGAGGGTAA 

GGAGTCGCCCTTTTTCACTTTGGGTTCTCAATGCTTAGAGCAGGATCAGATTTCAGATTAGT 
GTAGCGCTGTCTTTAACACTTAACATTTGCCTGTTTTATTCACCATGGACTCTAGAACTTTG 
AGCAGCACCTGGCACATCGTAAGAGGTTATTTTTTAAAGTTAGAATAATACATCTAAAATG 
TACATGAATGAATGAGAGGCCTGGGATGCCAGACTAAAGAGCTTTGACTTGGTCTAAAGGT 

20 GATGGGGAGCTAGGCAAAGGTTTTGAGAGTTTAACTTTAATTCAAAGTTCCCTTGGAGACT 
AATGTCTGGGGTAGGGGGAAGCCAGGGTAAGGGTCCGGGCCATGGAATGGGGTAGCTCAG 
TCGCTATCAAAAAGACAAGACTGTGACTATTTGGCTGAAGAAATGGCCAAACCCAGGTTTC 
TGGGGAGGTCGAGGTACCCTCAGTGAGGTCAGGACCTTCTCCTGGCCTATACTGTCCACCA 
GCAACCATCACACTCCTCCCTCCCCTCTCCCTTAGTTCCCCTCCCAATGGTACAGCCCTTGA 

25 CAGCAGGACAGACACACAGCCACCCCAAACACTTGTTCTCTCCTCAGTTTAATGGTGGTTA 
GTGAGATTGCCAAACCCCCTCCCCATTCCCCTCCCCACCCCGTACAAAATGTGTGTGTGGTT 
TTTTG'riU'iniGrrmTGTTTTTTAACAAGAAAAAGGGGGCAAAAGCCAGGAATGGGGAGA 
GGGGGGTGCAATCTGATATTTTCATACAGACTTTTGATTTTTTAATATATTATATATAAAAC 
CATGAAGACCACGAATCCTCCCCAAACTCCTTTCCCCCTCCCCGGGGGGCCTGGAGGAGAG 

30 ATGGGGAAGGCCCCCCCAGGAGTGGGTGGACAGAGAGACAAATATGGATGGGACAGACGT 
TGGGGGAGAAGGTAGAGAGAAGGGGAGCCCAGGAACCTGGGGAAGGGGGATTGGAGAAA 
AGGGTTGGGGCTGTCTCCCTCACTGCCCCCATCAAAGTTATGACACAAAGACACAGAATCC 
CTATTTCCACGCCCTCCCCCCACCCATCCCCCCACCGTGCAAACATGGCTTTGCAAAGAAGT 
GCCCAGAGCTCTGTGGAACTCTTACAATGGCTGGCATGGGGTCTAGGACCCCCAAAGAAAT 

35 CTGTGTTCCCCTTCCCTGCCCCCCCCACCCTTCCCAGAAACTGACCCCCTCCCCACAAGACC 
TGGTTTTGTAGCCTAGGGGCCCTGGCCTTCCCCCAGTTATCTTCCCCCAACCCAATCCCTAC 
TGCCCTCACTGGACTTGGGGGGTCTGGACCTTTGGCCCCTGCCCCCTGGGGGACCCAGACC 
TCTGGGCCCTCACTTCTGGCCCTTACAGAGATCCAGGCATCCAACACCCCCATCCCTGCCCA 
AGCGTCTGAGGTGTTAGTGGTGGGGGGAGAAGCCCACCATCCCAGACTCTGGTAAATGTCT 

40 TTGCTGGTTCCTTGCAGCTGGCAGTGGGGGGGACCCCAGCCCAGGCCCAGGCCTAGGCCTG 
GGGTGGGGATAGGGTCAGATGAAGAATTCCTCTTTCCTCTTGTGTCCGTCGCTGCCATTGAG 
GAAGGCTTCTCTTGCTTCTCCCTGTTCATCCAAGCCACTGGCTTCGTGGGTCAGATAGGAAC 
CTGAGGGGGTGACAGACCCCCGGGGCAGGGGGGACATATTTGTGGATCCAGGAGTTGGAC 
AGAAGTATAAGGGAAGAGGGAGACAGACAAGACACATGCCAGGCGAAGGAAGAGGGAGA 

45 AACGGAACACACAGGGAGAGGCAGAGAAAGAGGTAAACAGTGGCAGAGAAAGAGGTAAA 
AGCAGAATTAGGAAGACTCCAAAAGCTCACCGAAAGTGCCACCCTTATCCT TTCTC TTGGA 
GGTATTTCCTTGCCCTGCTCCCAGCGAATTCAGCA ATTAGGAAAATAAATTG i 1 1 1 ATTCAA 
ATCCATGCTClM'riM riCCCCTAATTTTTTGTATTTTTAGTAGAAAAGGGGCTGCGCCATGGT 
GCCCAGGCTGGTCTCGACCTCCTAGCTTCTCAAGTGCTT 

50 TATCCGCCTTGGCCTCCCAACGTGCTGGGATTACAGGCGTGAGCCACCGCGCCCAACCGCA 
AATCTATGCTTTTAATTCAGCTTCTAAATTCTACCCCnTTTCGAGTATTGTGCCGAAAGCCC 
CGCCCCCTTTGTCATCTCCGCCCCCGGTGCGGCGGGATTTGGAATCCAGAGCCTAGGCTCCG 
CCCTCTCGTTACCCTGGCTCTAGGCCCCGCCTCTTTCCGAGCCCTACAACCAACCAACCGTA 
GAGTCCAGGCCCCGTCCCACTCACCCTTCTGCCGTACCGAGCACCAGACCATGCCCACTAG 
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CACACATATGATCAGAAACACCAGCAGCGCCAGGATGCCGCCCACAATGGCATAGGGAAC 
CGACGTCTGAGCCTCTACCACCGCACCAGGGTCTGCCAGAGGGACACGGCACAGGACCAG 
GTCATCAGAGGACGATCCCAGTCTGGCCCCATCGCTGCCAAGCTTTTAAGCCATTCTGCAC 
ACGTCTAACCGTGCCCTTTTATGTGCCACACCCCTCAAAAATTACTGCCACCTTGTAGTCTC 
5 TTCTCTTTCCAGATGCTTGTTGG'nTGTACACTGCCCGACCCCTCCCCTGAGTCATGTTACAT 
TTTCCTTTTCTTTTTCTTGTTTTCTTTTGCAGAGACGGGGGTCTCACTATGTGGCCCAGGCTG 
ATCTTAAACTCCTGGGCTCAAGCGATCCTCCGGCCTAGGCCTCCCAAAGTACTGGGATTAG 
AGGCGTGAGCGACCGCACCCAGCCATCCCTTTTCTTTTGACTCAAGTTTCTTCCTCCACTAA 
GAAACAGAGTCCAAGAAACAGGTCCAAGTCCCTTCCCACCTTGTCTAAAACGCTCCAAGTA 

10 TTTAAAGTGCTGGGCCCAACTACCAAAATTTCTGCCCCACCGTCATAGAGCTAAACACAGA 
ACAGCTGTGTGCTAGAGCCCATTCCAACCACCTTACATATTTAGTTCACATAATCTTCACAA 
CAGCCTTGTTATATAGGTGCTATTGTTTATTTCCACTTTACTGATGGGTAAACTGAGGCGCA 
GACAGGTTCGGTTACCTGCAATAGAATGCAGCCAACCCGAATTTGAGCCCCGCGGGCCAGT 
CTGGTCCCAAAACAAAAAGAACTCTGTTGGCTGCCGAACCCCTGAGTTATGTGGCCTCTTT 

15 GCTCAAGCCCCGCCCCCGCCACCTGGCGCCCCGCCCCCGCCCTCAGTCGGCCGCAGCCTGC 
TCTCACCGTAGACCACAAGTACGTAGAGCGCCCTCGCATGGCCGTGCTTATTGGACGCCTC 
GCAAGTGTAGGTGCCGTTATCCGCGGATACCAGACCCGGCAGCGTGAGCGTCTCTCCCACG 
GCCTCCGCCCTCTCCGGCAAAGACTCATTCCCGCGGTTCCAGCGGATCT 
GGTTTGGCCTGGGTGGGGATAAAGTATAGTGAGAGTTAGGAACCGAGGTGCCAGCACCCA 

20 ATTCTGACTTGTCAAGAATCTAGACATGCAACTCTCATCCCGCAGGGACCTCCAAATAAGA 
GGCTTCCTGCTATCTCTTTCCTTTCTGGAAAACCAACAGTCCTGGGCCTACTTCCACCCATC 
ACCAAGGTCTCAGGAATTCTAGCCCAGGCTGAACATGGTGGCTTATGCCTGCAATCCCAGC 
ACTTTAGGAGGCTGAGACGGGAGGACTGCTTAAGGCCAGCAGTTCCAGACCAGCCTGGGCA 
ACACAGGGAGACCCCGTCACTACAATTAAAAAATAATAATAATAATAATAATAATTCTAGC 

25 CCTCCCACGCCATTCCATCCTCAGCAACCAGGAGTCTGAGGCTGCACAGCTTCAGTATTGG 
GGAGTCTGAGCCTCCAGATTCCTCCTCCCTCAGGATCCAGGAGTCCAGGTCCCAGATCCCT 
ATTCGTCCAGGTCCCCAGCTCTCTCCTCCTCAGGACCCAGGAATCCAGGTCCTAGCTCCCTG 
TTTGTCCAGGTCCTCAGCTCTCTCCTCCTTAGGACCCAGGAGTCCAAGTCCCTGGTCCCTGT 
TCTTCCAGGTCCCCAGCTTTCTCCTCCTGAGGACGCAGGAGGCCCCCAGAGCTCACCTGGG 

30 GTTCCCCGTGACAGCACACGTCAACACCAGCGTGTCTCCCTCCCTCACCACAGCTTGGGAG 
GCATGAATCCGGGCCGTGGGGGAGTCTGTTAGGCAAAAGTAAGAGGAGAGAGTAGTTTCC 
AAGCCATCACGCAGGACAAGGGGGACCCTCGCGGGTGCGGGTGGCTGGCGTTGGGATCCCT 
TGGGTCCTGGCCCGCCGGTCACTTACACTGCACATCCAGCACGTACTGCGTCTGCTTGCTGT 
GTCCGGAGGGCAGCGCCTGGTTCTGCGCCTCACAGATGATGATACCACCGTCGTCCTTACG 

35 GTCCACACGAAACCGTACTGTGCTTGCCACGCTCCAGACCTTGCCATTTTCCTGGCTGCTGC 
TCACTCCTGCCACACCCCGGTCAGACACTGTCAGGCCACAATTCCGGCTCCATCCACCCACC 
CACCCGAGCCAACGCCAAAGCAGGCTATTTGCCAAGCTCCACCCCTTACCCACAGGCCCCG 
CCTCTTGTCCTCCAAGCTACGCCCCTCCCCTAACCAAGCCCACGTGCCTCCTCCCAAAGCTC 
TTCCCTCTTTCACGCTCATGCTTTCTCGTCTATCAATCCATTTAATTGCTATATATATAAAAA 

40 CATAAATTTATATATATACTTAGAGACAGGGTCTCACAATGTTGGGCAGGTTGAACTCCTG 
ACCTCAAGCAATCCTCCCATCTCAGCCTCCCAAAGTGCTAGGACTACAGGC 
GTGAGCCACCGCGCTCGACATCAACCACTACATATTGAATGTCCAGTGTCTGTGAAAACCT 
GTGGCTCCTCTCCACATATAAACAACCTCTCCTAAGTCCCACCTCCTCCCCATCCCTTGTCA 
GCACTCGGCCCAGGGTACCTTTCAGCTCCTTGCGGTCCCGGTACCAGCGCAGGGTGGCAGC 

45 CGGACGGGACCGCGGAACGAGGCAGCTGAGCTCCACCTCGCCGCCCTCTACCGCCTGCTCC 
CGGACCTCCACCACAGGATTCTCTGGGGCCACTGCCGCAGGGAGAAGGGAAGTAAGGGGT 
TAAAGAAGGCACGAACGTGGGCTCAAAGCGATCGAGCTGCCTGTTCCCAGCGACCATAGG 
GAACCAGGGTCCCAGGTGGCAGGGGTCAAAGGGGAGAGGTCAGGAGCCAGATGCCCATCC 
AGGATGTTAAAAATAGCCATGGTCTGAAAGTCTCAGGAGAAGAGAGAAGCAGAGAAGAAA 

50 GGAGGAGAGGATGCGTCTGACAAGGGGGAGGGCGTTACCTAGTACCGTGAGCGTGGCAAT 
CTGGTGGTGGGTGTCTTCTGTGTAGAGCTGGCAGAAATAGCCCCCCTCGTCCTCCAGGCGG 
GCATCTGAGAGCCGGATCCGCACCCGGCGTGGGGAGAACTCCTCAAGCTGGAAACGCTCAT 
CCTTCAAGGCTAGAGAGAGTGAGGGGGAAGGTGTGAATTTCGGGAGTCCTGGCCTCACAAG 
TCCCACCCTTCCGACAGGAGCTTAGAGTCCAGCCCTCTGCCTCTTTTCTCCAGCCATATCTA 
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TGAGTCTGAGGTGTCCAACTATTTACTCCCTTGAGGACCCAGCATTATTCAAGTCCTCCTGC 
CTGCAGGACCAGCAGTCCGGGACCCCAGCCCTTTCTTCTCCGAGACCCAGGAGACCAAACT 
CTCAGGTGTGTCCTCTTTCAGGACATGGGAGCCTGGGCCCCAGCCCTCTCTTCCTTTAAGAC 
TCCTGAGTCTGGTCCCCAGCACTCACCACGGGTGCCATTGAAGAAGAGGGTCTGCCGGGCT 
5 GGGTTCTGGATGACAACTATGGACCCATCATACTGGTGCAGACGGCAGGTGATCTCAGCCA 
CCCCACCCTCAGCCACTGTCACGTTCTCTGTCTGTACTTCCTGTCCTGCCCCTGGACGATTA 
GACAAAGAGACAGGATAGAAGACTTACTGAGAGCTGCAATTCAATTTTTTCTTTCTCCCTCT 
TCCCCATCCAAACCTCCAATCCCTCTCTTTCCCCTCATTCATTCCATTGCACTGAACATTTCC 
TGCAGGCTAGAGTCCAGGACAGGGAGGAAATCTGCTCCCTACTCTAAAAGAGCTGCAGTCA 

10 AGATTTAGTAGAATATGCTCTAATGAGGGCAGCACAGGGCACACTAGGAGCCCAGAGCAA 
GGGAGGACTATTATAGAATTGCCTAGAGAGATGGGTAGCCAGAGAGGGCTCTGCAAGAAA 
GCTCCATTGGATCTGGATCTTAAAGAGTAAGCAGGAGGCTGAGCGCGGTGGCTCATGCCTG 
TAATCCCAGCACTTTGAGAGGCCGAGGTGGGCGGATCGCAAGGTCAAGAGATAGAGACCA 
TCCTGGCCAACATGGTGAAACCCTGTCACTACTAAAAATACAAAAAAAAAAAAAAAATTA 

15 GCTGGGTGTGGTGGTGCGCACCTGTAGTCCCAGCTACTCGGGAGGCTGAGGCAGGGGAATC 
GCTTGAACCCGGGAGTTGGAAGTTGCAGTGAGCCGAGATGGAGCCACTGCACTCCAGGCTG 
GGCGACAGAGCGAGACTCTGTCTCAAAAAAAAAAAGAAAGAAAAAAAAGAGTAAGCAGG 
AGTTCACAAGGTGTGGGAGACTGCTGTGTGTTCACCAAGCCTCATCTTTCACACCTGGGCA 
CATGTTGTAGCCCGTTTGCAAAGATAGCCGTAATATTCTCCTGTCCCTGGACATGCCCTTTG 

20 CAAGTTGATTTTGCCATTCCTCCCATTGAGAAGGCACTTTGTCCCCTACTAGTCTGGGTAAG 
CCTTGAGAGTTGCTTTGACCAATAGAATTTGCTAGAAGTGATATTGAGCCTAGGCCTGAAG 
AGGCCTTGTAGCTTCCACTCCTGCCCTAAGACTGTTGCATGAAGATACCCAGACTAGTGTCT 
TTGCAGATGAACAATCATGGTGAAAGAGAAGCCCAGCCGGCAGCCAGCACCAATCGCCAG 
CTGTGTGAGTGTGGCCATCCTGGATCATCCAGCCCCAGCTGCCCCACCAGCTGACAGCAGC 

25 CACACAAGTGACCCCAGTTGAGACCAATAAAAGATCTGCCCATCTGATACAGCCCAAACTG 
CTGAACCCCAGAATCATGAACAAATAAGGTGGTGGTTGTTTTAAGCTCCTAAGTTGTGGGT 
GATCTGTTCTACTGCTAAAGTTAACTGATACAATACATAATTAGGCTATACTTCCCAGCATC 
CTTTATAGTTAGGTGGGGCCATGTGACCAATTCTGGCCAATGGGATGTAGGTGGAAGAGAA 
ACACCTCTTGCAGCCTGAC 

30 CCATCTCCCTCATAATCCTTCACACTGGCTGAACAGAGAGGACTCCAAGGAGCCTAGAGGA 
GGGCAGAATCACAAGCCAGAAGGAACCTGGGTCTCTAACTGACTGTCCCCCATGACCCGCC 
TGTATAGGACTGTGATATGAGCAAGAAATATACCTTTTTGTTAAGCCATTGAGATTTCAGG 
GGTGTCTGTTACAGCCTTTAACCTACCCTGATTAATCCATCAGAAAAACAAGGTGGGGAAT 
CTAGAACCATCAGAGAAAAGCATTTAGGAAAGCTGAAAGCCAAGACTAATCATCAGCATT 

35 AATATCATCATCTGTTGTCTTCAAAATAACAATAACCCCCATAGCTACCAATTATTAGGTAC 
TTGCAGTGTTAGTCCCTGTGCTAAGGGCATTACCCATATAACTTACCTTTAATCCTCACAAT 
CCCTGTGTAAGGTAGACATGATTATTATCATTATTATTATTATTTTGGGACAGAGTATTGCT 
CTGTTGCCCAGGCTGGAGTGCAGTGGTGTGATCTCAGCTCATTGAAACCTCCACCTCCCAA 
GTTCAAGCGATTCTTCAGCCTCAGCCTCCCAAGTAGCTGGAATTACAGGCATGCACCACCA 

40 TGCCGGGCTAATTTTTATTTTTAGTAGAGACAGAGTTTAGCCATATTGGCCTGGCTGGTCTC 
GAACTCCTGGCCTCAAGTGATCCGCCTGCCTCAGCCTCCCAAAGTCCAGGGATTACAGGTG 
CGACCCACCGCGCCTGGCCAATTATTATTATTATTTTTAATTTGAGACAAGGTCAGGCTGGA 
GTGCAGTGGCACGATCTCAGCTCACTGCAATGTCTGCCTCCCAGGCTCGAGTGATCCCACCT 
CAGCCTCCCCAGTAGCTGGAACTACAGGTGCACAACATCACACCTGGCTAACTTTTGTATTT 

45 TTTTAGAGACGGAGTTTCACCGTGTTGCCCAGGCTGGTCTTGAACTTGCGAGCTCAAGTGA 
ACTGCCTGCTTCGGCCTCCCAAAGTGCTGGGATTACAGGCATGAGCCACTGTGCCCGGCCT 
GCGCTATTATTATCCCCATTTTGCCCGGCCTGCGCTACTATTATCCCCATTTTCCCCCATTTC 
CATTTTTCTTTTCTTTTTTTTTTTTTT^^ 

TAGAGTGCAGTGGTACGATCTCGGCTCACTGCAACCTCCACTTCCCGGGTTCAAGCAATTCT 
50 CCTGCCTCAGCCTCCCAAGTAGCTGGGATTATAGGCACCTGCCACTGCACTTGGCTAATCTT 
TGTGTTTTTAGTAAAGACGGGGTCTCACCATCTTGGCCAGGCTGGTCTGGAACTCCTGACCT 
CGTGATCCACCCGCCTCGGCCTCCCAAAGTGCTGGGATTACAGGCTTGAGCTATCGTGTCCT 
GCTCCCATTCCCATTTTATAGGTGAGAAAATTGGCCCACAGAGATGAAATGACTTGCCCAA 
GTTCACAGCCAAGAGTGGCAGTGCCAAAATCTTCGTCCAAATCTCTGATTCTGTATCCTGAA 
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TCTGTATATCCACTCCTGGCTGTCTGGATTAAGTGTCCATCATTGGCAGGGGGTTGTGAGAG 
CCGCTTGTGATGGGCCTCGAATGCCAACCTAGGAGATTTGCTTTCATCCTAAGGGCCAGTG 
AAGGTTTTGAAGCAGGAATATGCCATGATTAGATCTGGCTATTTGTCTTTAAGTGCTGGATA 
ACTATCCATGTCTTTTACATTCAGGTGCTGGGTTGCATTCATTCAGGAGTATTTCCTGAGCA 
5 TCACGTAGGTTTTCAGGGGCTGAGTAGTCAGAGATGAGTTAGATGAGGTCCCTGCCCTTTA 
AGATTTATGGGAAGGTAGGAACCAATCACGGTAATCAAAAGTGTTATGTGGCTGGGCACGG 
TGGCTCACACCTGTAATCCCAGCACTTTGGGAGGCCGAGGTGGGCGGATCACAAGGTCAGG 

agttcgagaccagcctgaccaacatggtgaaaccccgtctgtactaaaaatacaaaaatta 
gccaggtgtggtggtgggtgcttgtaattccagctactcaggaggctgaggcataagaatc 

10 gcttgaacctgggaggcagaggttgcagtgagccaagatcgcgccactgcagtccagcctg 
ggtgacagagcaagactccgtttcaaaaaagaaaaaaaaaaaagaaataaataaaagaaa 
gtgttatgttttctgtaagagggtaggtaacctaatttggaagttgaggggtagaaaagat 
tatttctgggggatggagacagagacttctggcttcctattctgacatccatttttcccttt 
ctcctcagtaaaagaaaagaacactggttgtattttatggttgcactatgtccagcagaaa 

15 aaggcattcctcagtctccttgcagcaaggtaaagccatctgataaaattttgtccagttgg 
atataagccaaaatgttgcgtgacaattttgggaggacttcctgaaacaggtggacaaacc 
ctttttctactgagtcacctttgtgccacctggaactaacagtgtgacgcgtggaatttagg 
cagccatattgaaccatgaggacaagagcagtggggatggcggaaccaagagctggaagg 
tgcctgagtctctggtgaagatgtggagctgctgtaacagccctcaactcctagttctggac 

20 TTCTTTTATGTTTTAGTGTAACGCTTTGGGTA I 11 ri A lMMM-rri AATTTATTTTAGAGATGA 

ggtctcactatgttgcctaggctggactcaaactcttatgctcaagcagtcctcctgcctca 
gcntcatgagtagctgaaactatagcactttgggtatttcagccactgtttgagglu"ri-rcr 
agcacctcctggaatatcaagcttaacatgtccaatccttgccccagatattttcctcccca 
aattttctcaatctcaataaatgtcaccaccatccacctggttgctcaggtcaaaaacctag 

25 aaatcattcaagttcrctccctttccctcatccccaatatccattccatcagcaacatctgt 
ccattctacctccaagacatatcccagatctcatcacctttgtctgcctctcctaccctcact 
ctcatccagcatcatccctcacctggactctgcaaaagcctactcgtgggtctgtctgcatc 
cctgtctgcctcctccagggccattctccacccagtggccggatcgatttttcaaagaggta 
aatcagatcaattcacctttctgcttaaaaccctccgagggctgcccgtaacatgtagaat 

30 aaaatagagaccccttcccggggacttcaaggtgctatatggcctggccccttgctgacct 
tacttcactctgggctcgctagccttgctgtccctcaaacatgctgagctcgctcccaccac 

AGGGCCTTTTCCCnnrTCTTCCTTCTGCCTGGAATGTTCTTCTCCCCACCTCCCAAGCCCCAT 
CTTCCCAGGGCTGACTCCTGTTCCCATTTGGGTCTCAAATCATATCAGTACCTTCTCAGAGA 
GGCCTTCCCTCACTGCTCATCCCTTCACCTTTAGAACACTTTCTTTTCTTTTAAGAGACAAA 

35 GTCAGCCCAGTGCGGTGGCTCACGCCTGTAATACCAGCACTTTTGAGAGGCCAAGGCGGGC 
AGATCACCTCAGGTCAGGAGTTCAAGACCAGCCTGGCCAACGTGGCGAAACCCCGTCTCTA 
CTAAAAAAATACAAAAATTAGCTAGGCAGTGGTAGCCCGGGCTACTCAGGAGGCTGAGGC 
AGAATTGCTTGAACCCAGGAGGCAGAGGTTGCAGTGAGCCGAGATTGAGCCACTGCACCCC 
AACCTGGGTGACAGAGAGAGACTCTGTCTCAAAAAAAAAAAAAAAAAAAAGAGACAGGGT 

40 ATTGCTCTGTCACCCAGGCTGGAGTGCAGTGGTGCAATCATGGCTCACTGCAGCCTCGAAC 
TCCTGGGCTCAAGCCATCCTCCCACCTCAGCCTCCTAAGTAGCTGAGATTATAGGCTCCTCC 
CACCACACCTGGCTAATTTTTGTGCTTTTTGTGGAGACACAGATTCTCCATGTTGCCCAGGC 
TGGTCTCCAACTCCTGGGGTCAAAGGATCCTCCTGCCTCGGCTTCCCAAAGTGCTGGGATTA 
CAGGCGTGAGCCACTGCGCCTGGCCCAGAACACTTGCTATTTCCTCACCATTGCTTTATTTC 

45 TTCTATGAAGATTTCACTGGAA 

TTATCAGATTAATTTGCTTATTTGTTTACTGTCTGTTTGTCACCCATGACTGGAATGTATACT 
CTAGGAAGGCAGGGATATAATCCAATGGGTTTACTGCTGCACCCCTAGTACCCAGAAGAGT 
GCTTGGCACCTGATAAGTGTCTGGGGAACTTGCTACATGAATTACATGTGTCAGATGGGAT 
ATCTGTTCGTCTTTCTTCTCTCl " I'lT rrCTTTCTCTCTTTCTCTCTCTCTTTCTTTCTCTTTCTT 

50 TCTITTTTCTTTTTTTGAGATAAGGTCTCGCTCTGTCACCCAGGCTAGAGTGCAGTGGTGCA 
ATCATGGCTCACTGCAACCTTGAACATGTGGGCTCAAGCGATCCTCCCACCTCAGGCTACC 
AAATAGCTAAGACTACAGAGGTGCGTAGCTATGCCCAGCTAATTAAAAAAAAAAAAATTTT 
TTTTTTTTTTTAGAGATGGGGGTCTCAATATCTTGCCCAGGTTGGTCTTGAACTCCTAGGCT 
CAAGCAATCCCCCTGCCTTGGCCTCCCAAAGTGCTGGGATTATAGGCATGAGCCATTGCAG 
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CTGGCCCAGACAGAATCTCATTTCAGCCCGACAACTTTGTGACATCATTATTTTCATCTTAA 
ACACCTAGGTTGATCCCAGCTCAACCACTTGCCATCTGTGTGACCTGTGGGCAAGTGACCTT 
ACCTTTCGGAGCCTCAGTTGCCCCATCTATAAAATGGGAATGATGCCAGTGCCTGCCTCATA 
AGGATGAGCCCCGCTCCTGAAGCTCAGGGAGCCCTCTCTGCAAGGCTG TTTTA GTGCAACC 
5 TCCGGAAACATGCCCATGCATGTGAAAACTGGCATGCACATTCTGGTGCTTTTAAA AACA T 
CTCGAAGCCTATCCACAGATCCTGGACCTCAAGACTGGTTCAGTGCTAGCCCCCCATTTTAC 
AGATGTGGAGAATGAGGCTTAGCGGGTCCCAGGCAAGTCAGTGGCAAAACTCACCATCTCC 
TGGGAGCCATCAGGTTCCTCTGGATCTGCCCCCACCAAATTTATCCCCTGCTCTCTGCTTGA 
GGGTGCACATGGGGTGAGGGTGGGGGTCTTTTGTTTTACTCCCTCCCCCTCCTGAGGAGTCA 

10 GTAACCAACAGTGTCTGTGCCTGGAATATTAATGTCTCAGCAGCTTTTGTTTGGGGGGTTGG 
GGGTGGTGGGGGCGGGACTTTCTGGTCAGAGAGGGGCTGAGCTTTGGGGACTGAGGCACTG 
GCCCTTTAAACTGTGTTGACAGCCAGGAGTCGTCATGGGGATGGTGCTTGGAAAAGGGGAC 
AGGGAGGGTTTGGGAAAGAGTGGCGGAGCAGGTAATGCGTAAGACCCAGGAATCCAGCCC 
CCAACTACCTCCTCTCCCAGGACCCAGGAGTCTAGGCTCCCAGC 

15 CCCTCCTCCATCAGGTTCCAGGAGTCTGGAACCCCGGCTTCTTTCCGCCTTAGACCCAGGAA 
TTCAGCCCCCAACCACCTCCTCTCTCAGGTTCCCGAAATCCAGACCCCTAGCCCCCTTCTCG 
ATCAGGACCCAGGAGTCTGGGCTGTCAGCAGCCCCTTCCTTCAAACCTAGGAGTCAGAGCC 
CCCAGCCCTCTCCTAGCTTAGACACAGGAGTCTGGGCCTCCAGCCCCCTCCTCCTTCAGGAC 
CCAGGAGCCAGGGGTCCAGAGTACACAGCTGGTGGATGTTTCCACGGAGACTAAGCAGGG 

20 TGGGGGGAGCGCTTCCTGGGTCCTGAGTCAGCGAATACCCAAGGGAGTCTCAAGGTCATAG 
TTCCGGGAAGGTCACCACCACCCCCTCTGTATCCGCTCCCCAGGGGGCTCCTGGCATCCTGC 
CTCCTTCCCCCTTCCTCCCTTAGGGAGGTGGTACATCCCTGCGTCCTGACTGAACCCCCCTC 
AGCCCCCCATCAATGGCGGAGTCCGAACATCCTCGCACAAAGCGTCAATTCTTCCCCAGCT 
CAGCCTTGTGAAGGCGCCTGTATTCGCAGGACCTAGGCGTCAGGGTCTCAGCCCCTCCTCC 

25 CTCAGAAACCTGCAGTGGAATCCCCCGCCTCCAGCCCCTTCCTCCCTCAGGACC CAGGA GT 
CTGTATCCTCATCCCTTCCTCCCTCAAGACCTAGGAGTGTGGACTCCCAGCCCCCTTTTCCT 
TCCGGACACAGGAGTTCCAGCCCTCGGCCCTCTCCTCTCTTAAACCCAGGGGTCTAAGACC 
CCAGCCTCCTCCTCCCTCAAACTCAGGAGTCTAAGATCCCAGGCCCCTCCTCCCTCAGACTC 
AGGAGTCTAAGATCCCAGGCCCCTCCTCCCTCAGACTCAGGAGTCTAAGACCCCAGGCCCC 

30 TCCTCCCTCAGACTCAGGAGTCTAAGATCCCAGGCCCCTCCTCCCTCAGACCCAGGAGTCTA 
AGACCCCAGCCCCTCCTCCCTCAGACTCAGGAGTCTAAGACCCCAGCCCCTCCTCCCTCAG 
ACTCAGGAGTCTAAGACCCCAGCCCCCTCCTCCCTGGACCCAGGAGCCTAAGACCTCAGCC 
CCCTCCTCCTTGAGACCCAGGAGTCTAAGACCCTAGCTCCCTCCTCCTTTAGACCCATTAGT 
CCAGGCCCCCAGACCCTCCTCCATCAGACCCAGGAGTCCAGGCCCCCAGCCCCTCCTCCAT 

35 CAGATCCAGCCCCTCCTCTCCTGAAAACTTTTGACTCTAACTCCCCAGTCCTCAACCCCTAG 
AAGCACAGTCCTGCCTTTCCTCAATCCTCTGTCCCCTCCCATCTGGGGACCTAGGCATCAGG 
TGGGGGCGTAGGGGTGAGTCAGCAACCTCACACACAAAGTCCCCGCTGTGGCCCCCACATT 
CCTGGGATATTCGGGACTCCCTGGATTCCAGGCCTCAGGCCCAGCCAGGGAGTGGGG 
AGTCCCCCAGAGGTCCTCCCTGGGTGTGGGGTACGAGAGGAATTCCTGCTCCGGGAAGGGT 

40 GCAGGCCTGCACTGAGCTCCCTCTGTCCGAACCTCCACGCCCAGTGCCCTCTATTCACCCCC 
TCTTCCCAGAAGAGCCCAGGCTCAGCACCTGCCCCTTGCCCCACTGGGTGCCCACGGAGGA 
GCCTGCGTGCCTGCTCCCTATGGGCCTGGGGTCTGCACAGGCGGAAATCAGTGGGTGCTTC 
CGTTCTGATGCCACAGGCCATTGGATGCTGGCGGGTCTGACTGTCTCCAGGCCACCCCCCA 
CCCCTCCCAGAGAGAGAAAGCTGCCTTTGTGTTCTCCAAGATGGGGACAGGCCAGGCTCGC 

45 ACGACATTAACCCAGCCTTAGGCCCCAGCCCTGCTGTGTCTAAGGTCTTGGAATCCACTGC 
AGAACCTGACCCCCACCCCCAGGCTCTGGGGACACAGGCGCCTGGCTCATGGGTGGGTGGG 
TGGGGGGGTCAGTGATAGAAACCTCCAAAACCTGTTCCTTGGGGTGACTCACAATGGAGGG 
AGGGTCCCCCTATTCTCAAGAGTGGCTGGTCAGAATTTTAGCAGGAAAAAGTGAGTCACCC 
TGGGAAGGAAACATTATTTAGGGACCAACAACTGCCCCCTCCACAAGACCCCTCAACTCCT 

50 AATAGCCTCTCTATTCTTTCTTTGTATTGGATATCTGTTTCCTCTCCTCCTTTCTGTTCTACCC 
AGTITCTGGCTGCGGGTCCCATTTCTGCCTGGGTGCATCCCTGGGCAGGCAACCCATCCCTC 
CCTCrrGCTTTCTCTCCTCTGCCCACCCTGGATCCTTCrrTGGGC ATAAA TCTCATCTTCTTC 
TGCTATGCTCAGAAGATGAATGAACCAGGAGAGAGAGAACATGTTTTTAAAATGGCGCAA 
ATGCACCCCATCTCCCCCGATTCCTGCTGGCTGGGCAAGGTGAGAGAGGAAGAAGTGACTA 
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AGAGAGAAATGTGGGAACAACAGATACCCCCTAAAATGTGGTAGCCAAGGCCACTGAGAA 
ATATCCAATGGAAAGGAGAGCAGGAAGGGCCCTCCAAGACCACATGCTACAGCCTCCTACC 
CCATGCTTTACAGAACGGGAAAGTAAGGCCCAGAGAGGGACAAGGACTGATGCAAAATTA 
TACTAAAGGGTCCTGGGTAAGGCTTGGACCCAAGTTCCTTAGCTCCCAGCTGAGAGCTCTT 
5 CCCATGACACCAAGCTCAGTTTCTACTGGTAAAAGCCACATACTATTTACTTTAGAGAAAG 
TTTACAGAGAGGGTTAGGGTGCCAGGAAGCAGTGACTTGGAAATCAAACGAGGGACAGGG 
CTGTAGACCTAACTCCCAGAAGCACCAGAGAAAGGCTTTTGCACGGGGCGGGTGGTCACCT 
TAAGCTATATTCTGATCCTGAGAATTCAAAGTCTGATGATTCTAAGCTGTCAGGATTCTAAA 
TGTCATAGATGTCAAGATCCAGGAACTCCAAGACATCAAGATTTCACGATTTTTAAGACGT 

10 CAAGATGCTAGCATGCTAACACCATCACGGTTCTAGAACTTTAAAGGTGTCAAGATTCTAA 
AGCCrrCTGGATTCTAGAATCCTGTAGATGTCAGCATTCTAAAGTACCATCAGGTTCTTTAT 
TTACTGGATTCATTAGTTCCAGGATTCTATGAGCCTGGTGTTTAGCCTAAAAAATAAAGATA 
AATTAAAATTGATGGAAATGTCACTGAGGTACCAAAGTTCTCATCTGGGAAATTGTGGCAT 
GTCTGTTGTAAAGAAAGGAGGTAATGATGCAAGTTCTAAAGCAGTCACAGAAGACTAGAG 

15 AAGAAAGAAAGACAGTGAGAGGACAGCTTTGCCCCTCATCCTGGCCGAGGTGAGGATGGC 
TCTGCCTCAAACCCTGGAGTGGGGAACATGTAACCGCACTCAACTTGCCAGAAACCCCTTC 
ACGGTCTGAGCTGGCGTTCCCTTTCATGTCACTGAGTTCAACATCCTCACTTTACAGAAAGA 
GAAACAGAAGCCTGGAGAGAGGAAGGTGTTTACCATTGGCTGCGATGGCAAATGGCAAGA 
GCCAAGATTTAAGCCCAGGCCGCCAGCCCCATGCCACCTGGTTATAACTCCTCTCACCAAT 

20 CTCTGCCGAACACCCAGCCCTCCTGCTTCTGCCTAGCCACCTTCCAATCCTCTGTTCCTTCC 
AAAAGTGGCCTTATCCACCAGGGAGGGGTGACCCGTGGCAGGTTCAAGACTTACACAGTGT 
GAGAGTGTGTGTGGGTGACATTTCCTGACCTTGTCCCCATTCTCAGGGTCACCCAACCTCGG 
GGGTCTCCAGCTTCTCACAGTGTGTGATGAGGGTATGTGGATGGCTCCCTGGATGTCCTGG 
ACAGGGGCTTCTCTGTGAGTCAAGCCTGGGTGTGTGAATGGGTGAGCAGGGTTTGGAGAGG 

25 CATTCGCTGAATCCACGTGTGTGCCTACACGCCAAGGTCCCCCATTCTCACTTCCCCACACA 
CATGCACACAGATGTTCCCCTCCAGGGCTCTTTAGAATGCCCTGCCTGACTGAATTCCTCTT 
CAGGGGCACAGAGGGATAGAGAGAGGGAGGAAGGTAGGATGGGAATGGGAGATCCCGGG 
ATGGAGGCTGTAAGCGTAGAGAGAGGAGGCACAGCAGAAAGACAGGGATGGAGATAGTGG 
GACAGAGAAGGGGGAAAGAGACAGGTGACAGAAAGGGTTAGAGAAACGAGTGACAGAAA 

30 GACAGGGGACAGAGACAAGGGGATGGGGCAGATAGGGGACAGAGAAAAAGGGACAGAAA 
AACAAGGGTGACAGCGAGACAGAGACAGGGACCAAGAATAGGGGCAGAGAGGGAGGGCA 
GAAATCCGGGGGAAAGAGAATAGACAGGATGATGGAGGGGACAGAGTGACCCAGGAAAA 
GGGGACAGAGACCAGGGGACAGAGGTAGGGGACAAAGACAGAATAGATGAGGAACACCG 
AGGCAAGAAGAGAGGGAGACAGACAGAAGGAGGGACAGGACTTCGAGACTGAGGGATAG 

35 AGGACAAGGGTAGGGGGACGAGGAGCCAGACGGGGGGGTTCAGAGACGGGCGGACAGAG 
GGACGCAGAGACTGGACAGAAGGACAGCGGGACCGGCCTGGGGAGGGCGGACTTGTGTGT 
GTAGGGGGGTCTCGGGCCCTTTGTCCCCGCCGGGATCCAGCCTGCGCGGGTGGGGGGGCTG 
CGGCACGGCGGCCGGGCCCCGCGCCCCCTCCCCCGCTCGTCGCTCCCGGCTCCCGGCCCGC 
GCTGCGCTTTGTCCCGGGGAGGGGGCCCGGCCCGGCCCCGCGCGCATTGTTCGGCCTCTGC 

40 GGCCCCGAGGCTGCCGGGCTGTCACCACAGCGCGCCCCCCGCCCCAGCCCGGCCGGCCGAC 
CCCGGCCCCCGACCCTACCTGGCCCCGCCGCGGCCGCCCACAGCAGCAGCAGCGGCCACTG 
GAAGCGCCGGGCCCGGCCCATGGTGCCGCCGCCGCCGCCGCCGCCGCTCGCTCCCGGCCCG 
GCACCTGCACCGCCCGCGCCGCCCGCCCCGCCCCCCGCGCCCCGCCCCCTGCCCGCCCGGG 
GGCGGGGCGCCGAGGCCGGGGCGGGGCCGGGGAGGGGAGGGGGAGACGGAGGAGAGGCC 

45 CGGAGACAATCGGGGGGACGGCACGGTGGGGGAACGGTGCGGGGTGCGAAAGCTGGAGAG 
GAGAGGGGTGAGGAGGGCGGGAAGGGGTGCGCGGGAGGGCGACAGCGGCGTGGGAGCAG 
GTGGGGGATCTCGGTGAGCGCGGGAAATGGAGGGTGTTGGGTGAGGGTGCTGCGTGCGGG 
CCCAGGTGCTGCGCGCGAGGGTGCGGAGTTGCTGGCATGCAGGGTGCTTGCGCTGCGCGGA 
GGGGAGGGTGGCAGGGTGTTGCTGGAGGCTGTGCGAGGGTGGGGGCGCGGGCGTCGTGGG 

50 GTGCGGTGTGTGCGAAGGGAGAGCGTGGCCAGCGTGACGGGGGAGCGTAAGGGAGGGAGT 
GCGACGTGGGAAAGGTGAGTGTGAGAGGCGTGCTGCGGGCAGGTGGGTGTCTGGAGTCTA 
GCGAGAGGCTGTGAGCTGAGCCACCGGGACAGGGGAGGCTGCAGCTGGAGGTCCGGAGGG 
TCCGGAGGTCGAGGCAGGTCAAGGATCTCCCAGGGCAGGGCGAGGCTGGGGCTCAGGAGT 
GGGGTGGGGTCAGTTCCCTCCCTCCCTCTCTCCTGTCCTGACCTGAAAACCCCGTGTTTCCG 
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CGTCATTCTCCGGGAGGGGCCCCCTGAAAGTGAACTAACTGGAAGGAAGCCTGAATCCTGG 
GTCCCAGGAGGGAGAGGCTCCTGTGAACACCTTCCAAGCCCTGGCGTCCCCTCTCCTCCCT 
GCTGTCTCCCTGCCCCAGCCTCTCTCCCTCTCTCTGCATGTATTTGCCTCTGCCCTTCCTCTC 
TCCCCATCTTTGAGGGTGACTCACCCCTCCAGACTTAGGTCCCTT 
5 CTCCCTCCTGGGAGTGGGTTTCCCTGAGCCCACTTCTGTGACACCCTGTAGACCTGATGCGG 
GATCATTACCTATGGGACCCAGAAAGAGTGAGAAACCATGGAAAGAAGGCCTCGACCTCTC 
TCATGCCCATTTGTCAGGCAAACTGAGGTCCAGAAGTGCCAATTATGAACATCTTTCCTTCC 
CCCCTCCCCCCTCCCCGCCCAGACGGAGTCTCGCTCTGTTGCCCAGGCTGGAGTGCAGTGGC 
ACGATCTCGACTCACTGCAACCTCTGCCTCCCAGGTTCCAGTGATTCTCCTGCCTCAGCCTC 
10 CCGAGTAG CTGA GATTACAGGCGCCCGCCACCATGCCTAGCTAATTTTTATATTTTTAGTAG 
AGACGGAGTTTTGCCATGCTGGCCAGGCTGGTCTTGAACTCCTTACCTCAGGTGATCCATCT 
GTCTGGCCTCCCAAAGTGCTGGATTACAGGCGTGAGCCACCATGCCTGGCTGAAAATCCTT 
ACTTTTTATTCCGACTAAAAAATTTTACATCCAGTCCCACAAGGGACTTCAGCTTCACACAC 
CCTTTCTGTCCTCAGTACCCAGCTCCCAGTATCCTTTCTGACCTCAAAACCATAGCTACCAT 

15 CAACCCTTGTGTCCCAGGACCATGGCTCCCAGTGTCTTCTCTGTCCTCAGGGTCCAAGCTCC 
CATCAACTCCTGTGTCCTCAGGACCACGGCTCCCAGCATCCTCTCTGTCCTTCAGGTCCAAG 
CTCCCATCAACCCCTGTGAAGCAGGACCATGGCTCCCAGCATCCTCTCTGTCCTCAGGGTCC 
AAGCTCCTATCAACTCCTGTGTCCCCAGGACGATGGCTCCAGCAATCCTCTCTGTCCTGAGA 
GCCCAAGCTTCTAACTGCCCCTGTGTCCCCAGATCCATAGCCCTGAGCAACTTCCTTCTTTT 

20 TCAGTCCTCAGCTTCCCAGCTTCTGTAGACrTGGGAAGAGATAGTCTCTAATCCTCT^ 

GGGCTCACATTCTGTGACTTTTGCTAGATGGGAGAGGAATGTTTGATCTGCCTTTGGAATAC 
TGGTCCAAGGGGTAACTAGTAGTTGCCTTTTCCCGCAGGAGCCAATAGGCCCGCTCACTCT 
GTGCTCTGACAGATGTCTCCTGCTCCAGCTGAAGGGGAACCTTGGGAGATGTTGGTTTGGTT 
CTCACCTGTCATCCTTAAGTCCCACCATTCCATGTGAAGACATCACAAGAGTAGTGGTCCTG 

25 ACGGGCGCGTTGGCTCACACCTGTAATCCCAGCACTTTGGGAGGCCAAGGTGGGCCGATCA 
CTTGAGGTCAGGAGTTTGAGACCAGCCTGACCAACCGGCCAACATGGTGAAACACCATCTT 
TACCAAAAAAAAAAAAAAAAATTAGCAAGGCGTGGTGGCACGTGCCTGTAATCCCAGCTG 
GTCGGAAGGCTGAGGCATGAGAATCCCCTGAACTTGGGAGGCAGAGGTTGCAGTGAGCTA 
AGATCATGCCACTGCACTCCAGCCTGGGTGACAGAATGAGACTCAGTCTAAATAATAATAA 

30 TAATAATAATAATAATAATAATAATAATAATAAATAGAATAGTGGTCCTGTCCCCATCCTA 
CTTCAGGGTACCCTGTCCATTAGGGATTTAGTGCAAGTGACAGCAAGTGCAACCCAACTGG 
TTTGAGAGAAAGAGAACTGGTTCACACATAACAAAAAGTCCTTCTATGGCTGGCTTTGGCG 
AGGTCTGTCAATCTCTGTCCTAAGGATGCATGGCTCCCCTCCTGTAGCAAGATGGCTGGCA 
GATACCCCTGGGGCCAGATTCATATTTGGGGTGATTAAGATTCTGCAAGAGAGAGACAACC 

35 TTTATTTCACACAGCTTTTCAATTGTTGCCTGTCCCTGGTGAGACTCGGAGACCTAGCTCTT 
GCCTGGTrrCrAAACTTTCAATAACACCGTTTTTGCTTAAGTCAGCACAAACAGATTTTAT^ 
TCTTGCAAGCAAAGATTCCTGAACAACAACTTCAGAGCCGTTAACAATGAGGTCCTGATCA 
CAAGCTATGGTATAGGACGTGAGAAATTTGTCCCTAGCCTCAATATCTGCTGGAGGGCATC 
ATGGAATAAGTATTTCTATCCTCTGATCCCCACTGTAGGGCATCATGGGATATATAATCCTA 

40 ACCTTCAATCTCTGCCATAGAGTTTCATAGGCAATGCAGTCCTAGCCTCAATATGTTGTAGG 
GAATTATGGGAAAGGTGAAATTATCCTCAATTATAATACAGAGCATCTCAGAAAATGTCGT 
TTTAGCCTCATCTCTGCTGTAGGGCATCATGGGAGATATACTTCTGGCCCAATTTTTGTTGT 
AAGTTGCCATAGAAGATGCAGTCTrTCCTTCCTTCCCTTTTTTCTTTTCTTTCTT^ 
'riUl'i'riU"li"lMATTATGTAGAGACAGGGTCTCTCGCrATGTTGCCCAGGCTGGTCCTGAACT 

45 CCTGGGCTCAAGCAGTTCTCCTGCCTTGGCCTCCCAAAGTGCTGGGATTACAGGCAAGAGC 
CATTGCACCCAGTCCCTTCTCTCCTTTCTTTCTTCATCACCTGCCATATTCCAGGCACTAGGA 
ATAAATCATCAAGTAAATAAACGGCCTTACCCTCCCTGGCAATTATAATGGGGAAAGTTAG 
CTAAAAACAAACAAAAATTACTGTTCCATTTAACCATCGCTGAATAACAAAATACCCCAGA 
ACGTAGTGGTGTGAAACAACAACCTTTTAATTTTATGATTCTGTGAGTCAGGAATTGGAGC 

50 AGGATTGGTGTGTATCTGCTTCATGATGAACTGGAGCCAAAAATGAACTAGCTGGAACAGC 
TGGAGATGGAGGGGAGGGGCATCAAGGGCCATATATCTAAGGCTGGTGGTTGGTGTTGTGG 
GTTTTGAATAGTGTCCTCCAAGTAAAATATATGTTGAAGTTCTAGCCCCTGGTATCTGTACA 
TGTGACCTTATTTGGAAATAAAATCTTTGCAAATGTAATTCACrri ITl GTTTGTTTGTTTGT 
TTGCTCGAGACTGAGTCTCGCTCTGTCACCCAGGCTGGAGTGCAGTGGCATGATCTCGGCTC 



112 



ACTGTAACCTTCACCTCCTGGGTTCAAGCGATTCTCCTGCCTCAGCCTCCCAAGTAGCTGGG 
ATTATAGGCACGTGTCACCATGCCCAGCTAATTTTTGTATTTTCAGTAGGGACGGGGTTTCA 
CCATGTTGGCCAGGCTGGTCTCGAACTCCTGACCTCAAATGATCTGCCACCTCAGCCTCCCA 
AAGTGCTGGGATTATAGGCATGGGGCACTGCATCCTGCCCAG ATGTGA TTA ACTTCTAACC 
5 CCTGGTATCTTTGCATGTGACTTTATTTGGAAATAAGGTGGG'n 11 1 1 ICTTGl 1 i i ri rri'l 
TTTTTTTGAGACAGTTTCACnTTGTCGCTCAGGCTGGAGTTCAGTTGCATAATCTCAGCTCA 
CTGAAACCTCTGCCTCCGAGGCTCAAGCGATCCTCCCGCC TCAGTC TCCCGAGTCAC TGGG 
ACTACGGGCAAGCGCCACCACACCCGGCTAATTGTTGCAGTrrTTGTAGAGATGGGGTTTT 
GCCATGTTGCCCAGGCGGTCTCCAATTGCCACCCTCAAGCAATTCATCCGCCTCGGCCTCCC 

10 AGAGTGCTGGAATTATAGGTGTGAGCCATGGCGCCCGGCCAGAAAGTCTTTGCAGATTTAG 
TTGAATTAATGACTAAATGTTTCCATGCTGAGTTAGAGTGGGCTCTAAATCCAATGATTGAT 
ATGGGGTTATAAGGAGAGATATTTGGAGACATAGCCACAGTCCCAGGGAAGGTGGACATT 
GGAAGACAGAGGTAGGGATTAGAGTGATGCAGCTACAAGCCAAGGAATGGCA AAGATTGC 
TGGCAGTCCCTCAGAAGCAAAGGAGAGGCAAGGAAGGGTTCTTCCCCTGAGACTTTTTTTT 

15 TTTTTTTTGAGACGGAGTCTCACTGCTGTCAGCCTCAGCTGGAGTGCAATGGCGCGATCTCG 
GCTCACTGCAACCTCTGCCTCCCAGGTTCCAGCAATTCTCCTGCCTCAGCCTCCCGAGTAAC 
TGAGATTACAGGCACCCGCCACCATGCCTGGCTAGTTTTTGCATTTTTAGTAGAGATGGGAT 
TTCACCCTGTTGGCCAGGCTGGTCTCGAACTCCTGACCTCAGGTGATCCACCCGCCTCGGCC 
TCCCAAAGTGCTGGGATTACAGGTGTCAGCCCCGGAGACTTTAAAA GCATG GCTCTTCCCC 

20 TGACGCTTTAAAAGCGTGGCTCTTCCCGTGAGACTTCAACACCTTGGTTTTGGACATTTAGC 
ATTCAGAACTGTGAGAGAACAAGTTTCTAGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTG 
TGTGTGTGTGTGTGTATGTGTTTTAGACAGAGGCTCATTCTGTTGCCCAGGCTGGAGTGCAG 
TGGTTCAATCTCGGCTCACTGCAAACTCCGCTTCTCAGATTCAAGTG ATTCTTATGCCTCAG 
CCTCCCAAGTAGCTGGAATTACAGAGGAGCGCCATCACAGCCGGCTA I i i i i i i i i 1 1 1 1 1 1 

25 TITGTACTTTTAGTAGAGACAGGGTTTCACTGTGTTGGCCAGGCTGGTCTCAAATTCCTGGC 
CTCAAGTGATATGCCTGCCTTGGCCTCCCAAAGTGCTGGGATT ACAGGTGTAAGCCAC CAC 
ACCTGGCCTAAGTTrCTGTGTGTGTGTGTGTGTGTTTTGTTTTGTTTT^ 
GGAGTCTCGCTCTGTTGCCCAGGCTGGAGTGCAGTGGCATGATCTCGACTCACTGCAAGCT 
CCGCCTCCCGGGTTCACGCCATTCTCCTGCCTCAGCCTCCCGAGTAGCTGGGACTACAGGCA 

30 CCCACCACCACGCCCAGTTAATTTTTTGTATTTTTAATAGTGACAGGGTTTCATCATGTTAG 
CCAGGATGGTCTCGATCTCCTGACCTCGTGATCCGCCCGCCTCAGCCTCCCGAATTGCTGGG 
ATrACAGGCATGAGCCACCAAACCCGGCCAAGTTTCTGTGGTTTTAAGCCACCTTGCTTGTA 
AGATTTGTGTGTGTGTGTTTTTAATTTTTTATTTTTAAGTATTAT GAATACA TAATAGTC 
TATATTTACAGGACATATGTAATATGGTTTrGGGTTTTAGTG'ri 11 I I I 1 1 IGGAGACAGAG 

35 TCTGGCTCTGTTGCCCAGGCTGGAGTACAGTGGTGGGATCATGGCTCACTGCAGCCTTGAC 
CTCCCGGGCTCAAGGGATCCTCCTGCCTCAGCCTCCCATGTAACTAGGACCACAGGCATGC 
CCCACCACATCCAGCCAATTTTTTTTTATTTTTAGTGGAGATGAGGTCTCACTGTGTTGCCC 
AGGCTGATCTTGAACTCCTGAGCTCAAGAGATCTTCCTTTCTCACCCTCCCAAAGTGCTAGG 
ACTACAGGCATGAGCCACTGTGCCTGTCCTTCCATGATGTTTTGATATAGGCACACAATGTG 

40 TrAGTTTATAAAGTTTGTAATAATTTATCACAGGCAGCCCTAGGAAACTAATATAGCCAAG 
TTTCCTGTTTCTTCTCTATATCACATCTGCTGGGGCTACATGTCCAAGGTGGCTTCTTCACCC 
ACITGTCTGGTGCCTGGGCTGAGATGGCTGAAACATCTGGGGCTCTATCTCCAC ATGGC ATT 
TATACATGAGTAGCTTGGGCTTCCTCACAGCATGGTGGTCTCAGGGCAGTAGTACTTTTACA 
TGGCAACCAGCTTCCCCAGAGTGAGCGTTCTAAGATTCAGAAAGTGAAAAATGAAAGTTTC 

45 TTAAAACTTGGTTCCAGAACATAGCACAGCAAAACTTCCACCACATTCTACTGGTCAAAGC 
AGTCACAGAGTCACTCATATTCAAGAGGCAGAAGTACAGACCTCACTTCTTTAAGCCACTA 
CAGTGACAGGTGGTGATATGTCATTAGAGAAAGCCCTAAAC AAGAA CCTTGTCCCTCACCT 
GCCCCCAAATACCATGGAAGATGTCri"! irni 1 III 11 I I II U II I'GGGGATAGTCTCACT 
GTGTCATGCAGTGGTGTGATC 

50 

SEQ ID 57 >gi)184426igb|M85289.1|HUMHSPG2B Human heparan sulfate proteoglycan (HSPG2) 
mRNA, complete cds 

GGCCGGCGAGCGGGCGGCTGCGGGCGGCGCGGAGCGGGCGGCGCGGAGCGAGCGAGCGA 
GAGAGCGGCGCGGGCCGGGCCATGGGGTGGCGGGCGCCGGGCGCGCTGCTGCTGGCGCTG 
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CTGCTGCACGGGCGGCTGCTGGCGGTGACCCATGGGCTGAGGGCATACGATGGCTTGTCTC 
TGCCTGAGGACATAGAGACCGTCACAGCAAGCCAAATGCGCTGGACACATTCGTACCTTTC 
TGATGATGAGTACATGCTGGCTGACAGCATCTCAGGAGACGACCTGGGCAGTGGGGACCTG 
GGCAGCGGGGACTTCCAGATGGTTTATTTCCGAGCCCTGGTGAATTTCACTCGCTCCATCGA 
5 GTACAGCCCTCAGCTGGAGGATGCAGGCTCCAGAGAGTTTCGAGAGGTGTCCGAGGCTGTG 
GTAGACACGCTGGAGTCGGAGTACTTGAAAATTCCCGGAGACCAGGTTGTCAGTGTGGTGT 
TCATCAAGGAGCTGGATGGCTGGGTTTTTGTGGAGCTCGATGTGGGCTCGGAAGGGAATGC 
GGATGGTGCTCAGATTCAGGAGATGCTGCTCAGGGTCATCTCCAGCGGCTCTGTGGCCTCC 
TACGTCACCTCTCCCCAGGGATTCCAGTTCCGACGCCTGGGCACAGTGCCCCAGTTCCCAA 

10 GAGCCTGCACGGAGGCCGAGTTTGCCTGCCACAGCTACAATGAGTGTGTGGCCCTGGAGTA 
TCGCTGTGACCGGCGGCCCGACTGCAGGGACATGTCTGATGAGCTCAATTGTGAGGAGCCA 
GTCCTGGGTATCAGCCCCACATTCTCTCTCCTTGTGGAGACGACATCTTTACCGCCCCGGCC 
AGAGACAACCATCATGCGACAGCCACCAGTCACCCACGCTCCTCAGCCCCTGCTTCCCGGT 
TCCGTCAGGCCCCTGCCCTGTGGGCCCCAGGAGGCCGCATGCCGCAATGGGCACTGCATCC 

15 CCAGAGACTACCTCTGCGACGGACAGGAGGACTGCGAGGACGGCAGCGATGAGCTAGACT 
GTGGCCCCCCGCCACCCTGTGAGCCCAACGAGTTCCCCTGCGGGAATGGACATTGTGCCCT 
CAAGCTGTGGCGCTGCGATGGTGACTTTGACTGTGAGGACCGAACTGATGAAGCCAACTGC 
CCCACCAAGCGTCCTGAGGAAGTGTGCGGGCCCACACAGTTCCGATGCGTCTCTACCAACA 
TGTGCATCCCAGCCAGCTTCCACTGTGACGAGGAGAGCGACiGTCCTGACCGGAGCGACGA 

20 GTTTGGCTGCATGCCCCCCCAGGTGGTGACACCTCCCCGGGAGTCCATCCAGGCTTCCCGG 
GGCCAGACAGTGACCTTCACCTGCGTGGCCATTGGCGTCCCCACCCCCATCATCAATTGGA 
GGCTCAACTGGGGCCACATCCCCTCTCATCCCAGGGTGACAGTGACCAGCGAGGGTGGCCG 
TGGCACACTGATCATCCGTGATGTGAAGGAGTCAGACCAGGGTGCCTACACCTGTGAGGCC 
ATGAACGCCCGGGGCATGGTGTTTGGCATTCCTGACGGTGTCCTTGAGCTCGTCCCACAAC 

25 GAGGCCCCTGCCCTGACGGCCACTTCTACCTGGAGCACAGCGCCGCCTGCCTGCCCTGCTTC 
TGCTTTGGCATCACCAGCGTGTGCCAGAGCACCCGCCGCTTCCGGGACCAGATCAGGCTGC 
GCTTTGACCAACCCGATGACTTCAAGGGTGTGAATGTGACAATGCCTGCGCAGCCCGGCAC 
GCCACCCCTCTCCTCCACGCAGCTGCAGATCGACCCATCCCTGCACGAGTTCCAGCTAGTA 
GACCTGTCCCGCCGCTTCCTCGTCCACGACTCCTTCTGGGCTCTGCCTGAACAGTTCCTGGG 

30 CAACAAGGTGGACTCCTATGGCGGCTCCCTGCGTTACAACGTGCGCTACGAGTTGGCCCGT 
GGCATGCTGGAGCCAGTGCAGCGGCCGGACGTGGTCCTCGTGGGTGCCGGGTACCGCCTCC 
TCTCCCGAGGCCACACACCCACCCAACCTGGTGCTCTGAACCAGCGCCAGQTCCAGTTCTC 
TGAGGAGCACTGGGTCCATGAGTCTGGCCGGCCGGTGCAGCGCGCGGAGCTGCTGCAGGTG 
CTGCAGAGCCTGGAGGCCGTGCTCATCCAGACCGTGTACAACACCAAGATGGCTAGCGTGG 

35 GACTTAGCGACATCGCCATGGATACCACCGTCACCCATGCCACCAGCCATGGCCGTGCCCA 
CAGTGTGGAGGAGTGCAGATGCCCCATTGGCTATTCTGGCTTGTCCTGCGAGAGCTGTGAT 
GCCCACTTCACTCGGGTGCCTGGTGGGCCCTACCTGGGCACCTGCTCTGGTTGCAGTTGCAA 
TGGCCATGCCAGCTCCTGTGACCCTGTGTATGGCCACTGCCTGAATTGCCAGCACAACACG 
GAGGGGCCACAGTGCAACAAGTGCAAGGCTGGCTTCTTTGGGGACGCCATGAAGGCCACG 

40 GCCACTTCCTGCCGGCCCTGCCCTTGCCCATACATCGATGCCTCCCGCAGATTCTCAGACAC 
TTGCTTCCTGGACACGGATGGCCAAGCCACATGTGACGCCTGTGCCCCAGGCTACACTGGC 
CGCCGCTGTGAGAGCTGTGCCCCCGGATACGAGGGCAACCCCATCCAGCCCGGCGGGAAGT 
GCAGGCCCGTCAACCAGGAGATTGTGCGCTGTGACGAGCGTGGCAGCATGGGGACCTCCGG 
GGAGGCCTGCCGCTGTAAGAACAATGTGGTGGGGCGCTTGTGCAATGAATGTGCTGACGGC 

45 TCTTTCCACCTGAGTACCCGAAACCCCGATGGCTGCCTCAAGTGCTTCTGCATGGGTGTCAG 
TCGCCACTGCACCAGCTCTTCATGGAGCCGTGCCCAGTTGCATGGGGCCTCTGAGGAGCCT 
GGTCACTTCAGCCTGACCAACGCCGCAAGCACCCACACCACCAACGAGGGCATCTTCTCCC 
CCACGCCCGGGGAACTGGGATTCTCCTCCTTCCACAGACTCTTATCTGGACCCTACTTCTGG 
AGCCTCCCTTCACGCTTCCTGGGGGACAAGGTGACCTCCTATGGAGGAGAGCTGCGCTTCA 

50 CAGTGACCCAGAGGTCCCAGCCGGGCTCCACACCCCTGCACGGGCAGCCGTTGGTGGTGCT 
GCAAGGTAACAACATCATCCTAGAGCACCATGTGGCCCAGGAGCCCAGCCCCGGCCAGCCC 
AGCACCTTCATTGTGCCTTTCCGGGAGCAAGCATGGCAGCGGCCCGATGGGCAGCCAGCCA 
CACGGGAGCACCTGCTGATGGCACTGGCAGGCATCGACACCCTCCTGATCCGAGCATCCTA 
CGCCCAGCAGCCCGCTGAGAGCAGGGTCTCTGGCATCAGCATGGACGTGGCTGTGCCCGAG 
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GAAACCGGCCAGGACCCCGCGCTGGAAGTGGAACAGTGCTCCTGCCCACCCGGGTACCGTG 
GGCCGTCCTGCCAGGACTGTGACACAGGCTACACACGCACGCCCAGTGGCCTCTACCTGGG 
TACCTGTGAACGCTGCAGCTGCCATGGCCACTCAGAGGCCTGCGAGCCAGAAACAGGTGCC 
TGCCAGGGCTGCCAGCATCACACGGAGGGCCCTCGGTGTGAGCAGTGCCAGCCAGGATACT 
5 ACGGGGACGCCCAGCGGGGGACACCACAGGACTGCCAGCTGTGCCCCTGCTACGGAGACC 
CTGCTGCCGGCCAGGCTGCCCACACTTGTTTTCTGGACACAGACGGCCACCCCACCTGTGAT 
GCGTGCTCCCCAGGCCACAGTGGGCGTCACTGTGAGAGGTGCGCCCCTGGCTACTATGGCA 
ACCCCAGCCAGGGCCAGCCATGCCAGAGAGACAGCCAGGTGCCAGGGCCCATAGGCTGCA 
ACTGTGACCCCCAAGGCAGCGTCAGCAGCCAGTGTGATGCTGCTGGTCAGTGCCAGTGCAA 

10 GGCCCAGGTAGAAGGCCTCACTTGCAGCCACTGCCGGCCCCACCACTTCCACCTGAGTGCC 
AGCAACCCAGACGGCTGCCTGCCCTGCTTCTGTATGGGCATCACCCAGCAGTGCGCCAGCT 
CTGCCTACACACGCCACCTGATCTCCACCCACTTTGCCCCTGGGGACTTCCAAGGCITTGCC 
CTGGTGAACCCACAGCGAAACAGCCGCCTGACAGGAGAATTCACTGTGGAACCCGTGCCCG 
AGGGTGCCCAGCTCTCTTTTGGCAACTTTGCCCAACTCGGCCATGAGTCCTTCTACTGGCAG 

15 CTGCCGGAGACATACCAGGGAGACAAGGTGGCGGCCTACGGTGGGAAGTTGCGATACACC 
CTCTCCTACACAGCAGGCCCACAGGGCAGCCCACTCTCGGACCCCGATGTGCAGATCACGG 
GCAACAACATCATGCTAGTGGCCTCCCAGCCAGCGCTGCAGGGCCCAGAGAGGAGGAGCT 
ACGAGATCATGTTCCGAGAGGAATTCTGGCGCCGGCCCGATGGGCAGCCGGCCACACGCGA 
GCACCTCCTGATGGCACTGGCCGACCTGGATGAGCTCCTGATCCGGGCCACGTTCTCCTCCG 

20 TGCCGCTGGTGGCCAGCATCAGCGCAGTCAGCCTGGAGGTCGCCCAGCCGGGGCCCTCAAA 
CAGACCCCGCGCCCTCGAGGTGGAGGAGTGCCGCTGCCCGCCAGGCTACATCGGTCTGTCC 
TGCCAGGACTGTGCCCCCGGCTACACGCGCACCGGGAGTGGGCTCTACCTCGGCCACTGCG 
AGCTATGTGAATGCAATGGCCACTCAGACCTGTGCCACCCAGAGACTGGGGCCTGCTCGCA 
ATGCCAGCACAACGCCGCAGGGGAGTTCTGCGAGCTTTGTGCCCCTGGCTACTACGGAGAT 

25 GCCACAGCCGGGACGCCTGAGGACTGCCAGCCCTGTGCCTGCCCACTGACCAACCCAGAGA 
ACATGTTTTCCCGCACCTGTGAGAGCCTGGGAGCCGGCGGGTACCGCTGCACGGCCTGCGA 
ACCCGGCTACACTGGCCAGTACTGTGAGCAGTGTGGCCCAGGTTACGTGGGTAACCCCAGT 
GTGCAAGGGGGCCAGTGCCTGCCAGAGACAAACCAAGCCCCACTCGTGGTCGAGGTCCATC 
CTGCTCGAAGCATAGTGCCCCAAGGTGGCTCCCACTCCCTGCGGTGTCAGGTCAGTGGGAG 

30 CCCACCCCACTACTTCTATTGGTCCCGTGAGGATGGGCGGCCTGTGCCCAGCGGCACCCAG 
CAGCGACATCAAGGCTCCGAGCTCCACTTCCCCAGCGTCCAGCCCTCGGATGCTGGGGTCT 
ACATITGCACCTGCCGTAATCTCCACCAATCCAATACCAGCCGGGCAGAGCTGCTGGTCAC 
TGAGGCTCCAAGCAAGCCCATCACAGTGACTGTGGAGGAGCAGCGGAGCCAGAGCGTGCG 
CCCCGGAGCTGACGTCACCTTCATCTGCACAGCCAAAAGCAAGTCCCCAGCCTATACCCTG 

35 GTGTGGACCCGCCTGCACAACGGGAAACTGCCCACCCGAGCCATGGATrrCAATGGCATCC 
TGACCATTCGCAACGTCCAGCTGAGTGATGCAGGCACCTACGTGTGCACCGGCTCCAACAT 
GTTTGCCATGGACCAGGGCACAGCCACTCTACATGTGCAGGCCTCGGGCACCTTGTCCGCC 
CCCGTGGTCTCCATCCATCCGCCACAGCTCACAGTGCAGCCCGGGCAACTGGCGGAGTTCC 
GCTGCAGCGCCACAGGGAGCCCCACGCCCACCCTCGAGTGGACAGGGGGCCCCGGCGGCC 

40 AGCTCCCTGCGAAGGCACAAATCCACGGCGGCATCCTGCGCCTGCCAGCTGTCGAGCCCAC 
GGATCAGGCCCAGTACTTGTGCCGAGCCCACAGCAGCGCTGGGCAGCAGGTGGCCAGGGCT 
GTGCTCCACGTGCATGGGGGCGGTGGGCCCAGAGTCCAAGTGAGCCCAGAGAGGACCCAG 
GTCCACGCAGGCCGGACCGTCAGGCTGTACTGCAGGGCTGCAGGCGTGCCTAGCGCCACCA 
TCACCTGGAGGAAGGAAGGGGGCAGCCTCCCACCACAGGCCCGGTCAGAGCGCACAGACA 

45 TCGCGACACTGCTCATCCCAGCCATCACGACTGCTGACGCCGGCTTCTACCTCTGCGTGGCC 
ACCAGCCCTGCAGGCACTGCCCAGGCCCGGATGCAAGTGGTTGTCCTTTCAGCCTCAGATG 
CCAGCCCACCGGGGGTCAAGATTGAGTCCTCATCGCCTTCTGTGACAGAAGGGCAAACACT 
CGACCTCAACTGTGTGGTGGCAGGGTCAGCCCATGCCCAGGTCACCTGGTACAGGCGAGGG 
GGTAGCCTGCCTCCCCACACCCAGGTGCACGGCTCCCGTCTGCGGCTCCCCCAGGTCTCACC 

50 AGCTGATTCTGGAGAATATGTGTGCCGTGTGGAGAATGGATCGGGCCCCAAGGAGGCCTCC 
ATTACTGTGTCTGTGCTCCACGGCACCCATTCTGGCCCCAGCTACACCCCAGTGCCCGGCAG 
CACCCGGCCCATCCGCATCGAGCCCTCCTCCTCACACGTGGCGGAAGGGCAGACCCTGGAT 
CTGAACTGCGTGGTGCCCGGGCAGGCCCACGCCCAGGTCACGTGGCACAAGCGTGGGGGC 
AGCCTCCCTGCCCGGCACCAGACCCACGGCTCGCTGCTGCGGCTGCACCAGGTGACCCCGG 
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REVENDICATIONS 



1. Utilisation d'au moins un polypeptide comprenant au moins un fragment 
d*une proteine pour obtenir une composition diagnostique, pronostique, prophylactique 

5 ou th^rapeutique destinee a detecter. prevenir ou traiter un etat pathologique associe a 
une maladie degenerative et/ou neurologique et/ou auto-immune, ladite proteine etant 
choisie parmi les proteines dont ia sequence peptidique i Tetat natif correspond a SEQ 
ID NM, SEQ ID N° 2, SEQ ID N° 3, SEQ ID N° 4, SEQ ID N° 5, SEQ ID N° 6, SEQ 
ID 7, SEQ ID N° 8, SEQ ID N° 10, SEQ ID N° 1 1, SEQ ID 12. SEQ ID N° 13, 

10 SEQ ID N° 14, SEQ ID N° 15, SEQ ID N° 16, SEQ ID 17, SEQ ID N° 18, SEQ ID 
N° 19, SEQ ID 20, SEQ ID 2i, SEQ ID N° 22. SEQ ID N° 23, SEQ ID N° 24, 
SEQ ID N° 25, SEQ ID N° 26, SEQ ID 27, SEQ ID N° 28 et SEQ ID N° 29, et les 
sequences peptidiques qui presentent au moins 70 % d'identite, de preference au moins 
80 % d'identite et avantageusement au moins 98 % d'identite avec Tune quelconque des 

15 sequences peptidiques SEQ ID N° 1 a SEQ ID N° 8 et SEQ ID N° 10 a SEQ ID N° 29, 
et les sequences peptidiques ou les fragments desdites sequences appartenant a une 
meme famille de proteines choisies parmi le perlecan, le precurseur de la proteine 
plasmatique de liaison au retinol, du precurseur de Tactivateur du gangliostde GM2, de 
la calgranuline B et de la saposine B. 

20 

2. Utilisation d'au moins deux polypeptides en combinaison, lesdits 
polypeptides comprenant chacun au moins un fragment d'une proteine, pour obtenir une 
composition diagnostique, pronostique, prophylactique ou therapeutique destinee a 
detecter, prevenir ou traiter un etat pathologique associe a une maladie degenerative 

25 et/ou neurologique et/ou auto-immune, ladite proteine etant choisie parmi les proteines 
dont la sequence peptidique a Tetat natif correspond a une sequence peptidique choisie 
parmi SEQ ID NM a SEQ ID N** 8 et SEQ ID N** 10, SEQ ID N** 29, el les sequences 
peptidiques qui presentent au moins 70 % d'identite, de preference au moins 80 % 
d'identite et avantageusement au moins 98 % d'identite avec Tune quelconque des 

30 sequences peptidiques SEQ ID N** I a SEQ ID N** 8 et SEQ ID 10 a SEQ ID N** 29, 
et ies sequences peptidiques ou les fragments desdites sequences appartenant a une 




meme famille de proteines choisies parmi le perlecan, le precurseur de la proteine 
plasmatique de liaison au retinol, du precurseur de Tactivateur du ganglioside GM2, de 
la calgranuline B et de la saposine B, 

5 3, Utilisation d'au moins un polypeptide comprenant au moins un fragment 

d'une proteine pour obtenir une composition diagnostique, pronostique, prophylactique 
ou therapeutique destinee a detecter, prevenir ou trailer un etat pathologique associe a 
une maladie degenerative et/ou neurologique et/ou auto-immune, ladite proteine etant 
choisie parmi les proteines dont la sequence peptidique a I 'etat natif correspond a SEQ 
10 ID N° 2, SEQ ID N° 4, SEQ ID N° 8, SEQ ID N° 17 et SEQ ID N° 24 et les sequences 
peptidiques qui presentent au moins 70 % d'identite, de preference au moins 80 % 
d*identite et avantageusement au moins 98 % d'identite avec Tune quelconque des 
sequences peptidiques SEQ ID N° 2. SEQ ID N° 4, SEQ ID N° 8, SEQ ID N° 17 et 
SEQ ID N° 24. 

15 

4. Utilisation selon la revendication 3, de cinq polypeptides en 
combinaison, lesdits polypeptides comprenant chacun au moins un fragment d*une 
proteine, pour obtenir une composition diagnostique, pronostique, prophylactique ou 
therapeutique destinee a detecter, pronostiquer, prevenir ou trailer un etat pathologique 

20 associe a une maladie degenerative et/ou neurologique et/ou auto-immune, ladite 
proteine etant choisie parmi les proteines dont la sequence peptidique a Tetat natif 
correspond a SEQ ID N° 2, SEQ ID N° 4, SEQ ID N° 8, SEQ ID 17 et SEQ ID N° 
24 et les sequences peptidiques qui presentent au moins 70 % d'identite, de preference 
au moins 80 % d'identite et avantageusement au moins 98 % d'identite avec I'une 

25 quelconque des sequences peptidiques SEQ ID N° 2,. SEQ ID N° 4, SEQ ID N° 8, SEQ 
IDN° 17 et SEQ ID N'* 24. 



5. Utilisation selon Tune quelconque des revendications 1 a 4, caracterisee 
en ce que la sequence peptidique dudit polypeptide comprend une sequence choisie 
30 parmi Tune quelconque des SEQ ID N° 2, SEQ ID 4, SEQ ID N° 8, SEQ ID N° 17 
et SEQ ID N° 24. 



ccgactcaggcgagtatgtgtgccatgtggtgggcacctccggccccctagaggcctcagt 
cctggtcaccatcgaagcctctgtcatccctggacccatcccacctgtcaggatcgagtctt 
catcctccacagtggccgagggccagaccctggatctgagctgcgtggtggcagggcaggc 
ccacgcccaggtcacatggtacaagcgtgggggcagcctccctgcccggcaccaggttcgt 

5 ggctcccgcctgtacatcttccaggcctcacctgccgatgcgggacagtacgtctgccggg 
ccagcaacggcatggaggcctccatcacggtcacagtaactgggacccagggggccaactt 
agcctaccctgccggcagcacccagcccatccgcatcgagccctcctcctcgcaagtggcg 
gaagggcagaccctggatctgaactgcgtggtgcccgggcagtcccatgcccaggtcacgt 
ggcacaagcgtgggggcagcctccctgtccggcaccagacccacggctccctgctgagact 

10 ctaccaagcgtcccccgccgactcgggcgagtacgtgtgccgagtgttgggcagctccgtg 
cctctagaggcctctgtcctggtcaccattgagcctgcgggctcagtgcctgcacttggggt 
cacccccacggtccggatcgagtcatcgtcttcgcaagtggccgaggggcagaccctggac 
ctgaactgcctcgttgctggtcaggcccatgcccaggtcacgtggcacaagcgcgggggca 
gcctcccggcccggcaccaggtgcatggctcgaggctacgcctgctccaggtgaccccagc 

15 tgattcaggggagtacgtgtgccgtgtggtcggcagctcaggtacccaggaagcctcagtc 
cttgtcaccatccagcagcgccttagtggctcccactcccagggtgtggcgtaccccgtccg 
catcgagtcctcctcagcctccctggccaatggacacaccctggacctcaactgcctggttg 
ccagccaggctccccacaccatcacctggtataagcgtggaggcagcttacccagccggca 
ccagatcgtgggctcccggctgcggatccctcaggtgactccggcagactcgggcgagtac 

20 gtgtgtcacgtcagtaacggtgcaggctcccgggagacctcgctcatcgtcaccatccagg 
gcagcggttcctcccacgtgcccagcgtctccccaccgatcaggatcgagtcgtcttccccc 
acggtggtggaagggcagaccttggatctgaactgcgtggtcgccaggcagccccaggcta 
tcatcacatggtacaagcgtgggggcagccttccctcccgacaccagacccatggctccca 
cctgcggttgcaccaaatgtctgtggctgactcgggcgagtatgtgtgccgggccaacaac 

25 aacatcgatgccctggaggcctccatcgtcatctccgtctcccctagcgccggcagcccctc 
cgcccctggcagctccatgcccatcagaattgagtcatcctcctcacacgtggccgaaggg 
gagaccctggatctgaactgcgtggtccccgggcaggcccatgcccaggtcacttggcaca 
agcgtgggggcagcctccccagtcaccatcagaccc 

gcggctcacggctgcggctgcaccatgtgtccccggccgactcgggtgaatacgtgtgccg 

30 ggtgatgggcagctctggccccctggaggcctcagtcctggtcaccatcgaagcctctggc 
tcaagtgctgtccacgtccccgccccaggtggagccccacccatccgcatcgagccctcctc 
ctcccgagtggcagaagggcagaccctggatctgaagtgcgtggtgcccgggcaggcccac 
gcccaggtcacatggcacaagcgtggaggaaacctccctgcccggcaccaggtccacggcc 
cactgctgaggctgaaccaggtgtccccggctgactctggcgagtactcgtgccaagtgac 

35 cggaagctcaggcaccctggaggcatctgtcctggtcacaattgagccctccagcccagga 
cccattcctgctccaggactggcccagcccatctacatcgaggcctcctcttcacacgtgac 
tgaagggcagactctggatctgaactgtgtggtgcccgggcaggcccatgcccaggtcacg 
tggtacaagcgcgggggcagcctccccgcccggcaccagacccatggctcccagctgcggc 
tccacctcgtctcccctgccgactcaggcgagtatgtgtgtcgtgcagccagcggcccagg 

40 ccctgagcaagaagcctccttcacagtcaccgtcccgcccagtgaggggtcttcctaccgc 
cttaggagcccggtcatctccatcgacccgcccagcagcaccgtgcagcagggccaggatg 
ccagcttcaagtgcctcatccatgacggggcagcccccatcagcctcgagtggaagacccg 
gaaccaggagctggaggacaacgtccacatcagtcccaatggctccatcatcaccatcgtg 
ggcacccggcccagcaaccacggtacctaccgctgcgtggcctccaatgcctacggtgtgg 

45 cccagagtgtggtgaacctcagtgtgcacgggccccctacagtgtccgtgctccccgaggg 
ccccgtgtgggtgaaagtgggaaaggctgtcaccctggagtgtgtcagtgccggggagccc 
cgctcctctgctcgttggacccggatcagcagcacccctgccaagttggagcagcggacat 
atgggctcatggacagccacgcggtgctgcagatttcatcagctaaaccatcagatgcggg 
cacttatgtgtgccttgctcagaatgcactaggcacagcacagaagcaggtggaggtgatc 

50 gtggacacgggcgccatggccccaggggcccctcaggtccaagctgaagaagctgagctg 
actgtggaggctggacacacggccaccttgcgctgctcagccacaggcagccccgcgccca 
ccatccactggtccaagctgcgttccccactgccctggcagcaccggctggaaggtgacac 
actcatcataccccgggtagcccagcaggactcgggccagtacatctgcaatgccactagc 
cctgctgggcacgctgaggccaccatcatcctgcacgtggagagcccaccatatgccacca 
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CGGTCCCAGAGCACGCTTCGGTGCAGGCAGGGGAGACGGTGCAGCTCCAGTGCCTGGCTCA 
CGGGACACCCCCACTCACCTTCCAGTGGAGCCGCGTGGGCAGCAGCCTTCCTGGGAGGGCG 
ACCGCCAGGAACGAGCTGCTGCACTTTGAGCGTGCAGCCCCTGAGGACTCAGGCCGCTACC 
GCTGCCGGGTCACCAACAAGGTGGGCTCAGCCGAGGCCTTTGCCCAGCTGCTCGTCCAAGG 
5 CCCTCCCGGCTCTCTCCCTGCCACCTCCATCCCAGCAGGGTCCACGCCCACCGTGCAGGTCA 
CGCCTCAGCTAGAGACCAAGAGCATTGGGGCCAGCGTTGAGTTCCACTGTGCTGTGCCCAG 
CGACCAGGGTACCCAGCTCCGTTGGTTCAAGGAAGGGGGTCAGCTGCCTCCGGGTCACAGC 
GTGCAGGATGGGGTGCTCCGAATCCAGAACTTGGACCAGAGCTGCCAAGGGACGTATATAT 
GCCAGGCCCATGGACCTTGGGGGAAGGCCCAGGCCAGTGCCCAGCTGGTTATCCAAGCCCT 

10 GCCCTCGGTGCTCATCAACATCCGGACCTCTGTGCAGACCGTGGTGGTTGGCCACGCCGTG 
GAGTTCGAATGCCTGGCACTGGGTGACCCCAAGCCTCAGGTGACATGGAGCAAAGTTGGAG 
GGCACCTGCGGCCAGGCATTGTGCAGAGCGGAGGTGTCGTCAGGATCGCCCACGTAGAGCT 
GGCTGATGCGGGACAGTATCGCTGCACTGCCACCAACGCAGCTGGCACCACACAATCCCAC 
GTCCTGCTGCTTGTGCAAGCCTTGCCCCAGATCTCAATGCCCCAAGAAGTCCGTGTGCCTGC 

15 TGGTTCTGCAGCTGTCTTCCCCTGCATAGCCTCAGGCTACCCCACTCCTGACATCAGCTGGA 
GCAAGCTGGATGGCAGCCTGCCACCTGACAGCCGCCTGGAGAACAACATGCTGATGCTGCC 
CTCAGTCCGACCCCAGGACGCAGGTACCTACGTCTGCACCGCCACTAACCGCCAGGGCAAG 
GTCAAAGCCTTTGCCCACCTGCAGGTGCCAGAGCGGGTGGTGCCCTACTTCACGCAGACCC 
CCTACTCCTTCCTACCGCTGCCCACCATCAAGGATGCCTACAGGAAGTTCGAGATCAAGAT 

20 CACCTTCCGGCCCGACTCAGCCGATGGGATGCTGCTGTACAATGGGCAGAAGCGAGTCCCA 
GGGAGCCCCACCAACCTGGCCAACCGGCAGCCCGACTTCATCTCCTTCGGCCTCGTGGGGG 
GAAGGCCCGAGTTCCGGTTCGATGCAGGCTCAGGCATGGCCACCATCCGCCATCCCACACC 
ACTGGCCCTGGGCCATTTCCACACCGTGACCCTGCTGCGCAGCCTCACCCAGGGCTCCCTG 
ATTGTGGGTGACCTGGCCCCGGTCAATGGGACCTCCCAGGGCAAGTTCCAGGGCCTGGATC 

25 TGAACGAGGAACTCTACCTGGGTGGCTATCCTGACTATGGTGCCATCCCCAAGGCGGGGCT 
GAGCAGCGGCTTCATAGGCTGTGTCCGGGAGCTGCGCATCCAGGGCGAGGAGATCGTCTTC 
CATGACCTCAACCTCACGGCGCACGGCATCTCCCACTGCCCCACCTGTCGGGACCGGCCCT 
GCCAGAATGGCGGTCAGTGCCATGACTCTGAGAGCAGCAGCTACGTGTGCGTCTGCCCAGC 
TGGCTTCACCGGGAGCCGCTGTGAGCACTCGCAGGCCCTGCACTGCCATCCAGAGGCCTGT 

30 GGGCCCGACGCCACCTGTGTGAACCGGCCTGACGGTCGAGGCTACACCTGCCGCTGCCACC 
TGGGCCGCTCGGGGTTGCGGTGTGAGGAAGGTGTGACAGTGACCACCCCCTCGCTGTCGGG 
TGCTGGCTCCTACCTGGCACTGCCCGCCCTCACCAACACACACCACGAGCTACGCCTGGAC 
GTGGAGTTCAAGCCACTCGCCCCTGACGGGGTCCTGCTGTTCAGCGGGGGGAAGAGCGGGC 
CTGTGGAGGACTTCGTGTCCCTGGCGATGGTGGGCGGCCACCTGGAGTTCCGCTATGAGTT 

35 GGGGTCAGGGCTGGCCGTTCTGCGGAGCGCCGAGCCGCTGGCCCTGGGCCGCTGGCACCGT 
GTGTCTGCAGAGCGTCTCAACAAGGACGGCAGCCTGCGGGTGAATGGTGGACGCCCTGTGC 
TGCGCTCCTCGCCCGGCAAGAGCCAGGGCCTCAACCTGCACACCCTGCTCTACCTGGGGGG 
TGTGGAGCCTTCCGTGCCACTGTCCCCGGCCACCAACATGAGCGCTCACTTCCGCGGCTGTG 
TGGGCGAGGTGTCAGTGAATGGCAAACGGCTGGACCTCACCTACAGTTTCCTAGGCAGCCA 

40 GGGCATCGGGCAATGCTATGATAGCTCCCCATGTGAGCGCCAGCCTTGCCAACATGGTGCC 
ACGTGCATGCCCGCTGGCGAGTATGAGTTCCAGTGCCTGTGTCGAGATGGATTCAAAGGAG 
ACCTGTGTGAGCACGAGGAGAACCCCTGCCAGCTCCGTGAACCCTGTCTGCATGGGGGCAC 
CTGCCAGGGCACCCGCTGCCTCTGCCTCCCTGGCTTCTCTGGCCCACGCTGCCAACAAGGCT 
CTGGACATGGCATAGCAGAGTCCGACTGGCATCTTGAAGGCAGCGGGGGCAATGATGCCCC 

45 TGGGCAGTACGGAGCCTATTTCCACGATGATGGCTTCCTCGCCTTCCCTGGCCATGTCTTCT 
CCAGGAGCCTGCCCGAGGTGCCCGAGACCATCGAGCTGGAGGTTCGGACCAGCACAGCCA 
GTGGCCTCCTGCTCTGGCAGGGTGTGGAGGTGGGAGAGGCCGGCCAAGGCAAGGACTTCAT 
CAGCCTCGGGCTTCAAGACGGGCACCtTGTCTTCAGGTACCAGCTGGGTAGTGGGGAGGCC 
CGCCTGGTCTCTGAGGACCCCATCAATGACGGCGAGTGGCACCGGGTGACAGCACTGCGGG 

50 AGGGCCGCAGAGGTTCCATCCAAGTCGACGGTGAGGAGCTGGTCAGCGGCCGGTCCCCAG 
GTCCCAACGTGGCAGTCAACGCCAAGGGCAGCGTCTACATCGGCGGAGCCCCTGACGTGGC 
CACGCTGACCGGGGGCAGATTCTCCTCGGGCATCACAGGCTGTGTCAAGAACCTGGTGCTG 
CACTCGGCCCGACCCGGCGCCCCGCCCCCACAGCCCCTGGACCTGCAGCACCGCGCCCAGG 
CCGGGGCCAACACACGCCCCTGCCCCTCGTAGGCACCTGCCTGCCCCACACGGACTCCCGG 
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GCCACGCCCCAGCCCGACAATGTCGAGTATATTATTATTAATATTATTATGAATTTTTGTAA 
GAAACCGAGGCGATGCCACGCTTTGCTGCTACCGCCCTGGGCTGGACTGGAGGTGGGCATG 
CCACCCTCACACACACAGCTGGGCAAAGCCACAAGGCTGGCCAGCAAGGCAGGTTGGATG 
GGAGTGGGCACCTCAGAAAGTCACCAGGACTTGGGGTCAGGAACAGTGGCTGGGTGGGCC 
5 CAGAACTGCCCCCACTGTCCCCCTACCCACCGATGGAGCCCCCAGATAGAGCTGGGTGGCC 
TGTTTCTGCAGCCCTTGGGCAGTTCTCACTCCTAGGAGAGCCAACCTCGGCTTGTGGGCTGG 
TGCCCCACAGCTACCTGAGACGGGCATCGCAGGAGTCTCTGCCACCCACTCAGGATTGGGA 
ATTGTCTTTAGTGCCGGCTGTGGAGCAAAAGGCAGCTCACCCCTGGGCAGGCGGTCCCCAT 
CCCCACCAGCTCGTTTTTCAGCACCCCCACCCACCTCCACCCAGCCCCTGGCACCTCCTCTG 

10 GCAGACTCCCCCTCCTACCACGTCCTCCTGGCCTGCATTCCCACCCCCTCCTGCCAGCACAC 
AGCCTGGGGTCCCTCCCTCAGGGGCTGTAAGGGAAGGCCCACCCCAACTCTTACCAGGAGC 
TGCTACAGGCAGAGCCCAGCACTGATAGGGCCCCGCCCACCGGGCCCCGCCCACCCCAGGC 
CACATCCCCACCCATCTGGAAGTGAAGGCCCAGGGACTCCTCCAACAGACAACGGACGGAC 
GGATGCCGCTGGTGCTCAGGAAGAGCTAGTGCCTTAGGTGGGGGAAGGCAGGACTCACGA 

15 CTGAGAGAGAGAGGAGGGGGATATGACCACCCTGCCCCATCTGCAGGAGCCTGAAGATCC 
AGCTCAAGTGCCATCCTGCCAGTGGCCCCCAGACTGTGGGGTTGGGACGCCTGGCCTCTGT 
GTCCTAGAAGGGACCCTCCTGTGGTCITTGTCTTGATTTTTCTTAATAAACGGTGCT 
CGCC 

20 GM2 activatcur 

SEQ ID 58 IPTGEPCPEP LRTYG 
SEQ ID 59 lES VLSSSGK RLG 
SEQ ID 60 ATPAQAHLKK PSQLSSFS 

25 Saposinc B 

SEQ ID 61 RIQAMIPKGA LRVAV 
SEQ ID 62 GICQCLAERY S VILL 

CalgranuUnc B 
30 SEQ ID 63 EKMHEGDEGF GHHHKPG 
SEQ ID 64 DLQ^fFLKKEN KNE 
SEQ ID 65 VKLGHPDTLN QGEFKELVR 

35 Peptide mute 1 

SEQ ID N° 68 FSWDNCFEGK DPAVIR 

SEQ ID N°66 TTYWSNTGGG AYAAYTGYTT YGARGGNAAR GAYCCNGCNG TNATHMGN 

40 

Peptide mute 2 

SEQ ID N° 69 YSLPKSEFA V PDLELP 

45 SEQ ID N%7 TAYWSNYTNC CNAARWSNGA RTTYGCNGTN CCNGAYYTNG ARYTNCCN 

SEQ ID N° 69 > NAME = 'Reverse-Translaiion of PERLECAN' : TYPE = DNA 
GAYGCNCCNGGNCARTAYGGNGCNTAYTTYCAYGAYGAYGGNTTYYTNGCKTTYCCNGGN 
CAYGT^^TYWSNMGNWSNYTNCCNGARGTNCCNGARACNATHGARYTNGARGTNMGNACN 
50 WSNACNGCNWSNGGNYTNYTNYTNTGGCARGGNGTNGARGTNGGNGARGCNGGNCARGGN 
AARGAYTTYATHWS^rYTNGG^^/TOCARGAYGGNCAYYTNGTNTTYMG^^'AYCARY™ 
WSNGGNGARGCNMGNYTNGTNWSNGARGAYCCNATHAAYGAYGGNGARTGGCAYMGNGT 
NACNGChTYTNMGNGARGGhn^GNMGNGGNWSNMGNCARGTNGAYGGNGARGARYTNGTO 
WSNGGNMGNWSNCCNGGNCCNAAYGTNGCNGTNAAYGCNAARGGNWSNGTNTAYATHGG 
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NGGNGCNCCNGAYGTNGCNAChmTslACNGGNGGNMGNTTYWSNWSNGGNATHACNGGNT 

GYGTNAARAAYYTNGTNYTNCAYWSNGCNMGNCCNGGNGCNCCNCCNCCNCARCCNYTNG 

AYYTNCARCAYMGNGCNCARGCNGGNGCNAAYACNMGNCCNTGYCCNWSN 

5 

SEQ ID N° 70> NAME = 'Reverse-Traiislalion of RBP ' : TYPE = DNA 

ATGAARTGGGTNTGGGCNYTNYTNYTNYTNGCNGCNTGGGCNGCNGCNGARMGNGAYTGY 
MGNGTNWSNWSNTTYMGNGTNAARGARAAYTTYGAYAARGCNMGNTTYWSNGGNACNTG 
GTAYGCNATGGCNAARAARGAYCCNGARGGhTYTNTTYYTNCARGAYAAYATHGTNGCNGA 

10 RTTYWSNGTNGAYGARACNGGNCARATGWSNGCNACNGCNAARGGNMGNGTNMGNYTNY 
TNAAYAAYTGGGAYGTNTGYGCNGAYATGGTNGGNACNTTYACNGAYACNGARGAYCCNG 
CNAARTTYAARATGAARTAYTGGGGNGTNGCNWSNTTYYTNCARAARGGNAAYGAYGAYC 
AYTGGATHGTNGAYACNGAYTAYGAYACNTAYGCNGTNCARTAYWSNrrGYMGNYTN\TNA 
AYYTNGAYGGNACNTGYGCNGAYWSbrrAYWSNTTYGTNTTYWSNMGNGAYCCNAAYGGN 

15 YTNCCNCCNGARGCNCARAARATHGTNMGNCARMGNCARGARGARYTNTGYYTNGCNMGN 
CARTA YMGNYTNATHGTNCAYAAYGGNTAYTGYGAYGGNMGNWSNGARMGNAAYYTNYT 

N 



20 SEQ 7 1 > NAME = 'Reverse-Translation of GM2MUT P : TYPE = DNA 

ATGCARWSNYTNATGCARGCNCCNYTNYTNATHGCNYTNGGNYTNYTNYTNGCNACNCCN 
GCNCARGCNCAYYTNAARAARCCNWSNCARYTNWSNWSNTTYWSNTGGGAYAAYTGYTTY 
GARGGNAARGAYCCNGCNGTNATHMGNWSNYTNACNYTNGARCCNGAYCCNATHGTNGTN 
CCNGGNAAYGTNACNYTNWSNGTNGTNGGNWSNACNWSNGTNCCNYTNWSNWSNCCNYT 

25 NAARGTNGAYYTNGTNYTNGARAARGARGTNGCNGGNYTNTGGATHAARATHCCNTGYAC 
NGAYTAYATHGGNWSNTGYACNTTYGARCAYTTYTGYGAYGTNYTNGAYATGYTNATHCC 
NACNGGNGARCCNTGYCCNGARCCNYTNMGNACNTAYGGNYTNCCNTGYCAYTGYCCNTT 
YAARGARGGNACNTAYWSNYTNCCNAARWSNGARTTYGCNGTNCCNGAYYTNGARYTNCC 
NWSNTGGYTNACNACNGGNAAYTAYMGNATHGARWSNGTNYTNWSNWSNWSNGGNAARM 

30 GNYTNGGNTGYATHAARATHGCNGCNWSNYTNAARGGNATH 
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6. Utilisation selon Tune quelconque des revendications 1 a 4, caracterisee 
en ce que la sequence peptidique dudit polypeptide consiste en une sequence choisie 
parmi Tune quelconque des SEQ ID N° 2, SEQ ID N° 4, SEQ ID N° 8, SEQ ID N° 17 

5 at SEQ ID N° 24. 

7. Utilisation d'un fragment polypeptidique defini dans la revendication 1 
ou dans la revendication 3 pour la preparation d'un peptide immunogene, caracterise en 
ce que ledit peptide comprend tout ou partie d'au moins une des sequences referencee 

10 SEQ ID N*» 58 a 65. 

8. Utilisation d'au moins un fragment nucleotidique, pour obtenir une 
composition diagnostique, pronostique, prophylactique ou therapeutique destinee a 
detecter, pronostiquer, prevenir ou trailer un etat pathologique associe a une maladie 

15 degenerative et/ou neurologique et/ou auto-immune, selon laquelle ledit fragment 
nucleotidique est choisi parmi des fragments qui codent pour au moins un fragment 
d*une proteine, ladite proteine etant choisie parmi les proteines dont la sequence 
peptidique a I'etat natif correspond a SEQ ID N° 1, SEQ ID 2, SEQ ID N° 3, SEQ 
ID N° 4, SEQ ID N° 5, SEQ ID N° 6, SEQ ID M** 7, SEQ ID N** 8, SEQ ID N« 10, 

20 SEQIDN° 11, SEQIDN° 12, SEQ ID N° 13, SEQ ID N° 14, SEQ ID N° 15, SEQ ID 
16, SEQ ID N° 17, SEQ ID N° 18, SEQ ID N° 19, SEQ ID N° 20, SEQ ID N° 21, 
SEQ ID N° 22, SEQ ID N° 23, SEQ ID N° 24, SEQ ID N° 25, SEQ ID N° 26, SEQ ID 
N° 27, SEQ ID N° 28 et SEQ ID W 29 et les sequences peptidiques qui presentent au 
moins 70 % d'identite, de preference au moins 80 % et avantageusement au moins 98 % 

25 d'identite avec Tune quelconque des sequences peptidiques SEQ ID N° 1 a SEQ ID N** 
8 et SEQ ID N° 10 a 29. les fragments complementaires desdits fragments et les 
fragments qui codent pour les sequences peptidiques ou les fragments desdites 
sequences appartenant a une meme famille de proteines choisie parmi le perlecan, le 
precurseur de la proteine plasmatique de liaison au retinol, du precurseur de I'activateur 

30 du ganglioside GM2, de la calgranuline B et de la saposine B. 
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9. Utilisation selon la revendication 8. caracterisee en ce que ledit fragment 
nucleotidique code pour ladite proteine. 

10. Utilisation scion la revendication 9, caracterisee en ce que la sequence 
5 peptidique de ladite proteine a I'etat natif consiste en une sequence choisie parmi Tune 

quelconque des SEQ ID N° 1 a 8 et SEQ ID N° 10 a 29 et les sequences peptidiques ou 
les fragments desdites sequences appartenant a une meme famille de proteines choisies 
parmi le perlecan, le precurseur de la proteine plasmatique de liaison au retinol, du 
precurseur de Tactivateur du ganglioside GM2, de la calgranuline B et de la saposine B. 

10 

1 1 . Utilisation d'au moins un fragment nucleotidique pour obtenir une 
composition diagnostique, pronostique, prophylactique ou therapeutique destinee a 
detecter, pronostiquer, prevenir ou traiter un etat pathologique associe a une maladie 
degenerative et/ou neurologique et/ou auto-immune selon laquelle ledit fragment est un 

15 fragment d*une sequence nucleique choisie parmi Tune quelconque des SEQ ID N** 30, 
SEQ ID N° 3 1, SEQ ID N° 32, SEQ ID N** 33, SEQ ID N° 34, SEQ ID N° 35, SEQ ID 
36, SEQ ID N° 37, SEQ ID N° 38, SEQ ID N** 39, SEQ ID N*' 40, SEQ ID N° 41, 
SEQ ID N° 42, SEQ ID N° 43, SEQ ID N° 44, SEQ ID N° 45, SEQ ID N° 46 et SEQ 
ID N° 47, SEQ ID 48, SEQ ID N** 49 et SEQ ID N** 50, SEQ ID N° 5 1, SEQ ID N° 

20 52, SEQ ID N'^ 53, SEQ ID N° 54, SEQ ID N° 55, SEQ ID N° 56, SEQ ID N° 57, 
SEQ ID N° 67, SEQ ID N° 68, SEQ ID N° 69, SEQ ID N° 70 et SEQ ID 71 et leurs 
sequences complementaires. 

12. Utilisation d'un ligand specifique d'un polypeptide ou d'un fragment 
25 nucleotidique selon Tune quelconque des revendications precedentes pour obtenir une 

composition diagnostique, pronostique, prophylactique ou therapeutique destinee a 
detecter, pronostiquer, prevenir ou traiter un etat pathologique associe a une maladie 
degenerative et/ou neurologique et/ou auto-immune. 
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13. Utilisation selon Tune quelconque des revendications precedentes, 
caracterisee en ce que la maladie degenerative et/ou auto-immune est la sclerose en 
plaques. 



5 14. Procede pour detecter au moins une proteine associee a une maladie 

degenerative et/ou auto-immune, dans un echantillon biologique, caracterise en ce que 
Ton met en contact I'echantillon biologique avec au moins un ligand specifique d'au 
moins un polypeptide, ledit polypeptide comprenant au moins un fragment d'une 
proteine et ladite proteine etant choisie parmi les proteines dont la sequence peptidique a 

10 I'etat natif correspond a SEQ ID N° 1, SEQ ID N° 2, SEQ ID N° 3, SEQ ID N° 4, SEQ 
ID 5, SEQ ID 6, SEQ ID N° 7, SEQ ID N° 8, SEQ ID iO, SEQ ID 1 1, 
SEQ ID N'' 12. SEQ ID N'' 13, SEQ ID N° 14, SEQ ID N° 15, SEQ ID N° 16, SEQ ID 
N** 17, SEQ ID N° 18, SEQ ID N** 19, SEQ ID N° 20, SEQ ID N° 21, SEQ ID N° 22. 
SEQ ID N° 23, SEQ ID N*' 24, SEQ ID N° 25, SEQ ID N° 26, SEQ ID N° 27, SEQ ID 

15 N** 28 et SEQ ID N° 29 et les sequences peptidiques qui presentent au moins 70 % 
d'identite de preference au moins 80 % dMdentite et avantageusement au moins 98 
d'identite avec Tune quelconque des sequences peptidiques SEQ ID N° 1 a SEQ ID N° 
8 et SEQ ID N** 10 a 29, et les sequences peptidiques ou les fragments desdites 
sequences appartenant a une meme famille de proteines choisies parmi le perlecan, le 

20 precurseur de la proteine plasmatique de liaison au retinol, du precurseur de Tactivateur 
du ganglioside GM2, de la calgranuline B et de la saposine B, puis on detecte la 
formation d'un complexe entre ledit polypeptide et ledit ligand. 



15. Procede seion la revendication 14, caracterise en ce que ledit ligand est 
25 un anticorps monoclonal, un anticorps polyclonal, un recepteur, un substrat d'activite 

enzymatique ou une enzyme dont ledit polypeptide est un cofacteur. 

16. Procede pour detecter au moins un ligand associe a une maladie 
degenerative et/ou auto-immune, dans un echantillon biologique, caracterise en ce que 

30 Pon met en contact Techantillon biologique avec au moins un polypeptide comprenant 
au moins un fragment d'une proteine, ladite proteine etant choisie parmi les proteines 
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dont la sequence peptidique a I'etat natif correspond a SEQ ID N*^ I, SEQ ID N° 2, 
SEQ ID N° 3, SEQ ID N° 4, SEQ ID N° 5 SEQ ID N° 6, SEQ ID N° 7, SEQ ID 8, 
SEQ ID N° 10, SEQ ID N° 1 1, SEQ ID N° 12, SEQ ID N° 13, SEQ ID N° 14, SEQ ID 
N** 15, SEQ ID N** 16, SEQ ID N° 17, SEQ ID N° 18, SEQ ID N° 19, SEQ ID N° 20, 
5 SEQ ID N° 21, SEQ ID N° 22, SEQ ID N° 23, SEQ ID N** 24. SEQ ID N° 25, SEQ ID 
N** 26, SEQ ID N° 27, SEQ IDN** 28 et SEQ ID N** 29, les sequences peptidiques qui 
presentent au moins 70 % d'identite, de preference au moins 80 % d'identite et 
avantageusement au moins 98 % d*identite avec I'une quelconque des sequences 
peptidiques SEQ ID N° 1 a SEQ ID N° 8 et SEQ ID 10 a SEQ ID 29, et les 
10 sequences peptidiques ou les fragments desdites sequences appartenant a une meme 
famille de proteines choisie parmi le perlecan, le precurseur de la proteine plasmatique 
de liaison au retinol, du precurseur de Tactivateur du ganglioside GM2, de la 
calgranuline B et de la saposine B, puis on detecte la formation d'un complexe entre 
ledit polypeptide et ledit ligand. 

15 

17. Procede selon la revendication 16, caracterise en ce que le ligand est un 
anticcrps, un recepteur, un substrat d'activite enzymatique ou une enzyme dont ledit 
polypeptide est un cofacteur. 



20 18. Precede selon Tune quelconque des revendications 14 a 17, caracterise 

en ce que !a sequence dudit polypeptide comprend une sequence peptidique choisie 
parmi I'une quelconque des SEQ ID N° 1 a 8 et SEQ ID N° 10 a 29. 

19. Procede selon Tune quelconque des revendications 14 a 17, caracterise 
25 en ce que la sequence dudit polypeptide consiste en une sequence peptidique choisie 

parmi Tune quelconque des SEQ ID N'' 1 a 8 et SEQ ID N** 10 a 29. 

20. Procede selon Tune quelconque des revendications 14 a 19, caracterise 
en ce que Techantillon biologique est taurine, le liquide cephalo-rachidien ou le serum. 



30 
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21. Precede selon Tune quelconque des revendications 14 a 20, caracterise 
en ce que la maladie degenerative et/ou auto-immune est la sclerose en plaques. 

22. Polypeptide caracterise en ce qu'il comprend au moins un fragment 
d'une proteine dont la sequence peptidique correspond a SEQ ID N° 9, ledit fragment 
comprenant au moins une mutation par rapport a la sequence de reference SEQ ID N** 8. 

23. Polypeptide selon la revendication 22, caracterise en ce qu'il comprend 
au moins deux mutations par rapport a la sequence de reference SEQ ID N'* 8. 

24. Polypeptide selon la revendication 22, caracterise en ce qu*il est choisi 
parmi les polypeptides qui comprennent la sequence en acides amines 
FSWDNCFEGKDPAVIR, referencee SEQ ID N° 68 et la sequence en acides amines 
YSLPKSEFAVPDLELP. referencee SEQ ID N° 69. 

25. Polypeptide selon Tune des revendications 22 a 24, caracterise en ce 
qu'il comprend une proteine dont la sequence peptidique correspond a SEQ ID N** 9. 

26. Polypeptide selon Tune des revendications 22 a 25, caracterise en ce 
qu'il consiste en une proteine dont la sequence peptidique correspond a SEQ ID N° 9. 

27. Utilisation d'au moins un polypeptide selon Tune quelconque des 
revendications 22 a 26 pour obtenir une composition diagnostique, pronostique, 
prophylactique ou therapeutique destinee a detecter, pronostiquer, prevenir ou traiter un 
etat pathologique associe a une maladie degenerative et/ou neurologique et/ou auto- 
immune. 

28. Utilisation selon la revendication 26, caracterisee en ce que le 
polypeptide tel que defini dans Tune quelconque des revendications 22 a 26 est utilise en 
melange avec au moins un polypeptide tel que defini dans Pune quelconque des 
revendications 1 a 5. 
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29. Procede pour detecter au moins un ligand associe a une maladie 
degenerative et/ou auto-immune, dans un echantillon biologique, caracterise en ce que 
Ton met en contact i*echantillon biologique avec au moins un polypeptide tel que defmi 

5 dans Tune quelconque des revendications 22 a 26, puis on detecte la formation d'un 
complexe entre ledit polypeptide et le ligand. 

30. Procede salon la revendication 29, caracterise en ce que Ton met en 
contact rechantilion biologique avec un polypeptide tel que defmi dans Tune quelconque 

10 des revendications 22 a 26 et avec au moins un polypeptide tel que defmi dans Tune 
quelconque des revendications 1 a 5. 

31. Procede selon la revendication 29 ou 30, caracterise en ce que ledit 
ligand est un anticorps. un recepteur, un substrat d'activite enzymatique ou une enzyme 

15 dont ledit polypeptide est un cofacteur. 

32. Procede pour detecter au moins un polypeptide tel que defmi dans l*une 
quelconque des revendications 22 a 26 dans un echantillon biologique caracterise en ce 
que Ton met en contact Techantillon biologique avec au moins un ligand specifique 

20 dudit polypeptide, puis on detecte la formation d'un complexe entre ledit polypeptide et 
ledit ligand. 

33. Procede selon la revendication 32, caracterise en ce que ledit ligand est 
anticorps monoclonal, un anticorps polyclonal, un recepteur, un substrat d'activite 

25 enzymatique ou une enzyme dont ledit polypeptide est un cofacteur. 

34. Procede selon la revendication 30 ou 3 1, caracterise en ce que Ton met 
en contact Techantillon biologique avec un ligand tel que defmi dans I'une quelconque 
des revendications 31 et 33 et au moins un ligand specifique d'au moins un polypeptide 

30 tel que defmi dans Tune quelconque des revendications 1 a 5. puis on detecte la 
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formation de complexes entre lesdits polypeptides et lesdits iigands specifiques desdits 
polypeptides. 

35. Procede selon la revendication 34, caracterise en ce que le ligand est un 
5 anticorps monoclonal, un anticorps polyclonal, un recepteur, un substrat d'activite 

enzymatique ou una enzyme dont ledit polypeptide est un cofacteur. 

36. Fragment nucleotidique caracterise en ce qu'ii code pour un 
polypeptide tel que defini dans Tune quelconque des revendications 22 a 26. 

10 

37. Utilisation d'un fragment nucleotidique pour obtenir une composition 
diagnostique, pronostique, prophylactique ou therapeutique destinee a detecter, 
pronostiquer, prevenir ou traiter un etat pathologique associe a une maladie 
degenerative et/ou auto-immune, selon laquelle ledit fragment nucleotidique est le 

15 fragment nucleotidique defini dans la revendication 35, eveniuellement en association 
avec au moins un fragment nucleotidique tel que defini dans Tune quelconque des 
revendications 8 a 1 1, et les fragments complement aires desdits fragments. 

38. Procede selon Tune quelconque des revendications 29 a 35, caracterise 
20 en ce que Techantillon biologique est Purine, le liquide cephalo-rachidien ou le serum. 

39. Procede selon Tune quelconque des revendications 29 a 36 caracterise 
en ce que la maladie degenerative et/ou auto-immune est la sclerose en plaques. 

25 40. Procede pour detecter au moins un polypeptide tel que defini dans Tune 

quelconque des revendications 1 a 5 ou dans Tune quelconque des revendications 22 a 
26, selon lequel on preleve un echantillon d'un fluide biologique d'un patient presentant 
un etat pathologique associe a une maladie degenerative et/ou neurologique et/ou auto- 
immune et eventuellement apres purification dudit echantillon de fluide biologique, on 

30 analyse par spectrometrie de masse le profil de masse obtenu a partir du fluide 
biologique et on compare a un profil de masse de reference. 
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41. Utilisation d*au moins un polypeptide comprenant au moins un 
fragment d'une proteine pour tester PefFicacite d'un agent therapeutique, ladite proteine 
etant choisie parmi les proteines dont la sequence peptidique a Tetat natif correspond a 

5 SEQ ID N*' 1, SEQ ID 2, SEQ ID N° 3, SEQ ID N° 4, SEQ ID N** 5. SEQ ID N° 6, 
SEQ ID N° 7, SEQ ID N° 8, SEQ ID N° 9, SEQ ID N** \ 0, SEQ ID N° 11. SEQ ID 
12, SEQ ID N° 13, SEQ ID N° 14, SEQ ID N° 15, SEQ ID N** 16, SEQ ID 17, 
SEQ ID N*' 18, SEQ ID N° 19, SEQ ID N° 20, SEQ ID N** 21, SEQ ID N** 22, SEQ ID 
N° 23, SEQ ID N° 24, SEQ ID N° 25, SEQ ID N° 26, SEQ ID N° 27, SEQ ID N° 28 et 

10 SEQ ID N° 29, les sequences peptidiques qui presentent au moins 70 % d'identite de 
preference au moins 80 % d*identite et avantageusenient au moins 98 d'identite avec 
Tune quelconque des sequences peptidiques SEQ ID N° 1 a 29, et les sequences 
peptidiques ou les fragments desdites sequences appartenant a une meme famille de 
proteines choisie parmi le perlecan, le precurseur de la proteine plasmatique de liaison au 

15 retinol, du precurseur de I'activateur du ganglioside GM2, de la calgranuline B et de la 
saposine B. 

42. Utilisation d*au moins un polypeptide comprenant au moins un 
fragment d'une proteine pour definir un materiel biologique pour la preparation d'une 

20 composition pharmaceutique destinee au traitemem d'une maladie degenerative et/ou 
neurologique et/ou auto-immune, telle que la sclerose en plaques, ladite proteine etant 
choisie parmi les proteines dont la sequence peptidique a I'etat natif correspond a SEQ 
ED 1. SEQ ID N° 2, SEQ ID N° 3, SEQ ID N° 4, SEQ ID N° 5, SEQ ID N° 6, SEQ 
ID 7, SEQ ID N° 8, SEQ ID N*' 9, SEQ ID N° 10, SEQ ID N° 1 1. SEQ ID N° 12. 

25 SEQ ID N** 13, SEQ ID N° 14, SEQ ID N° 15. SEQ ID N** 16, SEQ ID N** 17, SEQ ID 
18, SEQ ID N** 19. SEQ ID N° 20, SEQ ID N** 21. SEQ ID N° 22, SEQ ID N° 23. 
SEQ ID N° 24. SEQ ID N** 25, SEQ ID 26, SEQ ID 27. SEQ ID 28 et SEQ 
ID N° 29, les sequences peptidiques qui presentent au moins 70 % d'identite de 
preference au moins 80 % d'identite et avantageusement au moins 98 d'identite avec 

30 i'une quelconque des sequences peptidiques SEQ ID N° 1 a 29, et les sequences 
peptidiques ou les fragments desdites sequences appartenant a une meme famille de 




proteines choisie parmi le perlacan, le precurseur de la proteine plasmatique de liaison au 
retinol, du precurseur de I'activateur du ganglioside GM2, de la calgranuline et de la 
saposine. 

43. Utilisation selon la revendication 41 ou 42, caracterisee en ce que le 
polypeptide est choisi parmi SEQ ID N° 2, 4.8, 9, 1 7, 24. 



44. Utilisation d'au moins un fragment nucleotidique, pour tester 
I'efficacite d'un agent therapeutique pour un etat patliologique associe a une maladie 
degenerative et/ou neurologique et/ou auto-immune, selon laquelle ledit fragment 
nucleotidique est choisi parmi les fragments qui cedent pour au moins un fragment 
d*une proteine, ladite proteine etant choisie parmi les proteines dont la sequence 
peptidique a Tetat natif correspond a SEQ ID N° 1, SEQ ID N° 2, SEQ ID N** 3, SEQ 
ID 4, SEQ ID N** 5, SEQ ID N** 6, SEQ ID N« 7, SEQ ID N<> 8, SEQ IDN*^ 9, SEQ 
ID N° 10, SEQ ID N** 1 1, SEQ ID W 12, SEQ ID N° 13, SEQ ID N° 14. SEQ ID N° 
15, SEQ ID N° 16, SEQ ID N° 17, SEQ ID 18, SEQ ID N° 19, SEQ ID N** 20, 
SEQ ID N** 21 , SEQ ID N° 22. SEQ ID N** 23, SEQ ID N*^ 24, SEQ ID 25, SEQ ID 
N° 26, SEQ ID N° 27, SEQ ID N° 28 et SEQ ID N° 29, les sequences peptidiques qui 
presentent au moins 70 % d'identite, de preference au moins 80 % et avantageusement 
au moins 98 % d'identite avec Tune quelconque des sequences peptidiques SEQ ID N° 
1 a 29, et les fragments complementaires desdits fragments et les fragments qui cedent 
pour les sequences peptidiques ou les fragments desdites sequences appartenant a une 
meme famille de proteines choisie parmi le perlecan, le precurseur de la proteine 
plasmatique de liaison au retinol, du precurseur de I'activateur du ganglioside GM2, de 
la calgranuline B et de la saposine B. 

45. Utilisation pour tester refficacite d'un agent therapeutique pour un 
etat pathologique associe a une maladie degenerative et/ou neurologique et/ou auto- 
immune, de proteines recomblnantes et/ou codees par tout ou partie des fragments 
nucleotidiques definis a la revendication 44. 
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46. Utilisation d'au moins un fragment nucleotidique pour la preparation 
d*une composition pharmaceutique destinee au traitement d'une maladie degenerative 
et/ou neurologique et/ou auto-immune, telle que la sclerose en plaques, selon iaquelle 
ledit fragment nucleotidique est choisi parmi des fragments qui codent pour au moins un 

5 fragment d'une proteine, ladite proteine etant choisie parmi les proteines dont la 
sequence peptidique a I'etat natif correspond a SEQ ID 1 . SEQ ID N'' 2. SEQ ID N° 
3, SEQ ID N° 4, SEQ ID 5, SEQ ID N** 6, SEQ ID N° 7, SEQ ID N° 8, SEQ IDN° 
9, SEQ ID N° 10, SEQ ID N<» 1 1, SEQ ID N° 12, SEQ ID N** 13, SEQ ID N° 14, SEQ 
ID N° 15, SEQ ID N° 16, SEQ ID N° 17, SEQ ID N° 18, SEQ ID N° 19, SEQ ID N° 

10 20, SEQ ID N° 21, SEQ ID N*^ 22, SEQ ID N° 23, SEQ ID N° 24, SEQ ID N° 25, 
SEQ ID N° 26, SEQ ID N° 27, SEQ ID N° 28 et SEQ ID N° 29, les sequences 
peptidiques qui presentent au moins 70 % d*identite. de preference au moins 80 % et 
avantageusement au moins 98 % d'identite avec Tune quelconque des sequences 
peptidiques SEQ ID N° 1 a 29, et les fragments complementaires desdits fragments et 

15 les fragments qui codent pour les sequences peptidiques ou les fragments desdites 
sequences appartenant a une meme famille de proteines choisie parmi le perlecan, le 
precurseur de la proteine plasmatique de liaison au retinol, du precurseur de I'activateur 
du ganglioside GM2, de la calgranuline B et de la saposine B. 

20 47. Utilisation pour la preparation d*une composition pharmaceutique 

destinee au traitement d'une maladie degenerative et/ou neurologique et/ou auto- 
immune, telle que la sclerose en plaques, de proteines recombinantes et/ou codecs par 
tout ou partie des fragments nucleotidiques definis a la revendication 46. 

25 48. Utilisation selon la revendication 44 ou 46, caracterisee en ce que ledit 

fragment nucleotidique code pour ladite proteine. 
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49. Utilisation selon la revendication 48, caracterisee en ce que la sequence 
peptidique de ladite proteine a Petal natif consiste en une sequence choisie parmi Tune 
quelconque des SEQ ID N° 1 a 29, les sequences peptidiques qui presentent au moins 
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70 % d'identite de preference au moins 80 % d'identite et avantageusement au moins 98 
d*identite avec I'une quelconque des sequences peptidiques SEQ ID N° 1 a 29, et les 
sequences peptidiques ou les fragments desdites sequences appartenant a une meme 
famille de proteines choisies parmi le perlecan, le precurseur de la proteine plasmatique 
de liaison au retinol, du precurseur de I'activateur du ganglioside GM2, de la 
calgranuline B et de la saposine B. 



50. Utilisation selon la revendication 49, caracterisee en ce que les 
polypeptides sont choisis parmi SEQ ID N° 2, 4, 8, 9, 1 7, 24. 

51. Utilisation d'au moins un fragment nucleotidique, pour tester 
!*eff!cacite d'un agent therapeutique pour un etat pathologique associe a une maladie 
degenerative et/ou neurologique et/ou auto-immune selon laquelle ledit fragment est un 
fragment d'une sequence nucleique choisie parmi Tune quelconque des SEQ ID N° 30, 
SEQ ID N° 3 1, SEQ ID N° 32, SEQ ID N° 33, SEQ ID 34, SEQ ID N° 35, SEQ ID 
N° 36, SEQ ID N° 37, SEQ ID N° 38, SEQ ID N° 39, SEQ ID N° 40, SEQ ID N° 41, 
SEQ ID N° 42, SEQ ID N° 43, SEQ ID N° 44, SEQ ID N° 45, SEQ ID N° 46 et SEQ 
ID N° 47. SEQ ID 48, SEQ ID N*' 49 et SEQ ID N« 50, SEQ ID 5 1 , SEQ ID N« 
52, SEQ ID N° 53, SEQ ID N« 54, SEQ ID N** 55, SEQ ID N° 56, SEQ ID 57, 
SEQ ID N*' 66, SEQ ID N° 67, SEQ ID N° 68, SEQ ID N° 69, SEQ ID N°70 , SEQ ID 
N*' 71, et leurs sequences compiementaires. 



52. Utilisation d*au moins un fragment nucieotidique pour la preparation 
d*une composition pharmaceutique destinee au traitement d*une maladie degenerative 
et/ou neurologique et/ou auto-immune, telle que la sclerose en plaques selon laquelle 
ledit fragment est un fragment d'une sequence nucleique choisie parmi Tune quelconque 
des SEQ ID N° 30. SEQ ID N° 31. SEQ ID N'' 32, SEQ ID N*» 33, SEQ ID N** 34, 
SEQ ED N° 35, SEQ ID N** 36, SEQ ID N*^ 37, SEQ ID N° 38, SEQ ID 39, SEQ ID 
N° 40, SEQ ID N° 41, SEQ ID N*' 42, SEQ ID N° 43, SEQ ID N° 44, SEQ ID N° 45, 
SEQ ID N° 46 et SEQ ID N° 47, SEQ ID N° 48,* SEQ ID N° 49 et SEQ ID N° 50, SEQ 
ID N° 51, SEQ ID N° 52, SEQ ID N° 53, SEQ ID N° 54, SEQ ID N° 55, SEQ ID 
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56, SEQ ID N° 57, SEQ ID N** 66, SEQ ID N°67, SEQ ID N'' 68, SEQ ID 69, SEQ 
ID N'^TO , SEQ ID N° 71, et leurs sequences complementaires. 

53. Utilisation selon la revendication 51 ou 52, caracterisee en ce que la 
5 sequence nucleique est choisie parmi SEQ ID N° 30, 3 1, 42, 53. 

54. Utilisation de la lycorine pour la preparation d'une composition pour la 
prevention et/ou le traitement de maladie degenerative et/ou neurologique et/ou auto- 
immune. 

10 



De preference, ledit fragment nucleotidique code pour une proteine qui a 
Tetat natif consiste en une sequence choisie parmi Tune quelconque des SEQ ID N®s 1 a 
8 et SEQ ID N'^s 10 a 29 precitees, et parmi les sequences peptidiques ou les fragments 
desdites sequences appartenant a une meme famille de proteines choisies parmi le 
5 perlecan, le precurseur de la proteine plasmatique de liaison au retinol, du precurseur de 
I'activateur du ganglioside GM2, de la calgranuline B et de la saposine B. 

Un autre objet de Tinvention est Tutilisation d'au moins un fragment 
nucleotidique pour obtenir une composition diagnostique, pronostique, prophylactique 

10 ou therapeutique destinee a detecter, pronostiquer, prevenir ou traiter un etat 
pathologique associe a une maladie degenerative et/ou neurologique et/ou auto-immune 
selon laquelle ledit fragment est un fragment d'une sequence nucleique choisie parmi 
Tune quelconque des SEQ ID 30, SEQ ID N*' 31, SEQ ID N° 32, SEQ ID N° 33. 
SEQ ID 34, SEQ ID N° 35, SEQ ID N° 36, SEQ ID N° 37, SEQ ID N° 38, SEQ ID 

15 N° 39, SEQ ID 40, SEQ ID N° 41, SEQ ID N'^ 42, SEQ ID N° 43, SEQ ID N° 44, 
SEQ ID N° 45, SEQ ID N° 46 et SEQ ID N° 47, SEQ ID N° 48, SEQ ID N° 49 et SEQ 
ID N° 50, SEQ ID N° 51, SEQ ID N° 52, SEQ ID N° 53, SEQ ID 54, SEQ ID N** 
55, SEQ ID N° 56. SEQ ID N° 57, SEQ ID N° 67. SEQ ID N° 66, SEQ ID N° 69, 
SEQ ID N° 70 et SEQ ID N° 71 et leurs sequences complementaires. 

20 

L'invention conceme egalement Putilisation d'un ligand specifique d'un 
polypeptide ou d'un fragment nucleotidique tel que defini ci dessus pour obtenir une 
composition diagnostique, pronostique, prophylactique ou therapeutique destinee a 
detecter, pronostiquer, prevenir ou traiter un etat pathologique associe a une maladie 

25 degenerative et/ou auto-inunune. 

Par ligand, on entend toute molecule susceptible de s'associer au 
polypeptide, tel que un anticorps monoclonal, un anticorps polyclonal, un recepteur, un 
substrat d'activite enzymatique, une enzyme dont ledit polypeptide est un co-facteur. La 
production d'anticorps polyclonaux et monoclonaux fait partie des connaissances 

30 generales de I'homme du metier. On peut citer a titre de reference KOhler G. et Milstein 
C. (1975) : Continuous culture of fused cells secreting antibody of predefined 
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peptidiques ou les fragments desdites sequences appartenant a une meme famille de 
prot6ines choisies parmi le perlecan, le precurseur de la proteine plasmatique de liaison 
au retinol, du precurseur de i'activateur du ganglioside GM2, de la calgranuline B et de 
la saposine B. 

5 L' invention conceme egalement un nouveau polypeptide qui comprend au 

moins un fragment d'une proteine dont la sequence peptidique correspond k SEQ ID N° 
9, ledit fragment presentant au moins une mutation, en particulier au moins deux 
mutations par rapport a la sequence de reference SEQ ID N° 8. Le polypeptide est 
avantageusement choisi parmi les polypeptides qui comprennent la sequence en acides 

10 amines FSWDNCFEGKDPAVIR, referencee SEQ ID N° 68 et la sequence en acides 
amines YSLPKSEFAVPDLELP, referencee SEQ ID N° 72. 

En particulier, ledit polypeptide comprend ou consiste en SEQ ID 9. Ce 
polypeptide est utilise pour obtenir une composition diagnostique, pronostique, 
prophylactique ou thdrapeutique destinee a d6tecter, pronostiquer, prevenir ou trailer un 

15 etat pathologique associe a une maladie degenerative et/ou auto-immune, seul ou en 
melange avec au moins un polypeptide tel que defini precedemment. 

L'un des objet de I'invention est egalement un fragment nucleotidique qui 
code pour le fragment de la proteine dont la sequence peptidique correspond a SEQ ID 
N** 9, ledit fragment de ladite proteine presentant au moins une mutation, en particulier 

20 deux mutations par rapport a la sequence de reference SEQ ID N° 8. Ledit fragment 
nucleotidique, en particulier, comprend ou consiste en un fragment qui code pour SEQ 
ID N° 9. Ce fragment est utilise pour obtenir une composition diagnostique, 
pronostique, prophylactique ou therapeutique destinee a detecter, prevenir ou trailer un 
etat pathologique associe a une maladie degenerative et/ou auto-immune, seul ou en 

25 melange avec au moins un fragment nucleotidique tel que defini precedemment. 

L' invention a aussi pour objet un precede pour detecter au moins un ligand 
associe a une maladie degenerative et/ou auto-immune, dans un echantillon biologique, 
selon lequel on met en contact Techantillonjbiologique avec au moins le polypeptide qui 
comprend ou consiste en SEQ ID N** 9 ou un melange de polypeptides comprenant ce 

30 polypeptide et au moins un polypeptide tel que decrit ci dessus, puis on d^tecte la 
formation d'un complexe ou de complexes entre le ou les polypeptides et le ou les 




-Utilisation pour la preparation d'une composition pharmaceutique 
destinee au traitement d'une maladie degenerative et/ou neurologique et/ou auto- 
immune, telle que la sclerose en plaques, de proteines recombinantes et/ou codees par 
tout ou partie des fragments nucleotidiques defmis au paragraphe precedent ; 
5 Avantageusement, ledit fragment nucleotidique utilise code pour ladite 

proteine ; 

De preference, la sequence peptidique de ladite proteine a I'etat natif 
consiste en une sequence choisie parmi Tune quelconque des SEQ ID 1 a 29, les 
sequences peptidiques qui presentent au moins 70 % d*identite de preference au moins 

10 80 % d'identite et avantageusement au moins 98 dMdentite avec Tune quelconque des 
sequences peptidiques SEQ ID N° 1 a 29, et les sequences peptidiques ou les fragments 
desdites sequences appartenant a une meme famille de proteines choisies parmi le 
perlecan, le precurseur de la proteine plasmatique de liaison au retinol, du precurseur de 
I'activateur du ganglioside GM2, de la calgranuline B et de la saposine B. Les 

15 polypeptides sent preferentiellement choisis parmi SEQ ID N° 2, 4, 8, 9, 17, 24. 

- Utilisation d'au moins un fragment nucleotidique, pour tester Tefficacite 
d*un agent therapeutique pour un etat pathologique associe a une maladie degenerative 
et/ou neurologique et/ou auto-immune selon iaquelle ledit fragment est un fragment 
d'une sequence nucleique choisie parmi Pune quelconque des SEQ ID N° 30, SEQ ID 

20 N** 31, SEQ ID N° 32, SEQ ID N° 33, SEQ ID N*' 34, SEQ ID 35. SEQ ID N*^ 36, 
SEQ ID N'' 37, SEQ ID N° 38, SEQ ID N** 39, SEQ ID N° 40, SEQ ID N** 41. SEQ ED 
N** 42, SEQ ID N** 43, SEQ ID 44, SEQ ID 45. SEQ ID 46 et SEQ ID N** 47, 
SEQ ID N*' 48, SEQ ID N** 49 et SEQ ID N° 50, SEQ ID N** 5 1 , SEQ ID N** 52, SEQ 
ID N° 53, SEQ ID N° 54, SEQ ID 55, SEQ it) N° 56, SEQ ID N° 57, SEQ ID N** 

25 66, SEQ ID N° 67, SEQ ID N° 69. SEQ ID N°70 . SEQ ID N° 71, et leurs sequences 
compiementaires . 

-Utilisation d'au moins un fragment nucleotidique 
pour la preparation d'une composition pharmaceutique destinee au traitement 
d'une maladie degenerative et/ou neurologique et/ou auto-immune, telle que la sclerose 
30 en plaques selon Iaquelle ledit fragment est un fragment d'une sequence nucleique 
choisie parmi Tune quelconque des SEQ ID N« 30, SEQ ID N** 3 1. SEQ ID 1^ 32. SEQ 
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GCCACGCCCCAGCCCGACAATGTCGAGTATATTATTATTAATATTATTATGAATnTTGTAA 
GAAACCGAGGCGATGCCACGCTTTGCTGCTACCGCCCTGGGCTGGACTGGAGGTGGGCATG 
CCACCCTCACACACACAGCTGGGCAAAGCCACAAGGCTGGCCAGCAAGGCAGGTTGGATG 
GGAGTGGGCACCTCAGAAAGTCACCAGGACTTGGGGTCAGGAACAGTGGCTGGGTGGGCC 
5 CAGAACTGCCCCCACTGTCCCCCTACCCACCGATGGAGCCCCCAGATAGAGCTGGGTGGCC 
TGTTTCTGCAGCCCTTGGGCAGTTCTCACTCCTAGGAGAGCCAACCTCGGCTTGTGGGCTGG 
TGCCCCACAGCTACCTGAGACGGGCATCGCAGGAGTCTCTGCCACCCACTCAGGATTGGGA 
ATTGTCTTTAGTGCCGGCTGTGGAGCAAAAGGCAGCTCACCCCTGGGCAGGCGGTCCCCAT 
CCCCACCAGCrCGTTTTTCAGCACCCCCACCCACCTCCACCCAGCCCCTGGCACCTCCTCTG 

10 GCAGACTCCCCCTCCTACCACGTCCTCCTGGCCTGCATTCCCACCCCCTCCTGCCAGCACAC 
AGCCTGGGGTCCCTCCCTCAGGGGCTGTAAGGGAAGGCCCACCCCAACTCTTACCAGGAGC 
TGCTACAGGCAGAGCCCAGCACTGATAGGGCCCCGCCCACCGGGCCCCGCCCACCCCAGGC 
CACATCCCCACCCATCTGGAAGTGAAGGCCCAGGGACTCCTCCAACAGACAACGGACGGAC 
GGATGCCGCTGGTGCTCAGGAAGAGCTAGTGCCTTAGGTGGGGGAAGGCAGGACTCACGA 

15 CTGAGAGAGAGAGGAGGGGGATATGACCACCCTGCCCCATCTGCAGGAGCCTGAAGATCC 
AGCTCAAGTGCCATCCTGCCAGTGGCCCCCAGACTGTGGGGTTGGGACGCCTGGCCTCTGT 
GTCCrAGAAGGGACCCTCCTGTGGTCTTTGTCTTGATTTTTCTTAATAAACGGTGCTATCCC 
CGCC 

20 GM2 activateur 

SEQ ID 58 IPTGEPCPEP LRTYG 
SEQ 3D 59 lESVLSSSGK RLG 
SEQ ID 60 ATPAQAHLKK PSQLSSFS 

25 Saposine B 

SEQ ID 61 RIQAMIPKGA LRVAV 
SEQ ID 62 GICQCLAERY SVILL 

Calgranuline B 
30 SEQ ID 63 EKMHEGDEGP GHHHKPG 
SEQ ID 64 DLQNFLKKENKNE 
SEQ ID 65 VKLGHPDTLN QGEFKELVR 



35 Peptide mut€ 1 

SEQ ID N*» 68 FSWDNCFEGK DPA VIR 

SEQ ID N*»66 TTYWSNTGGG AYAAYTGYTT YGARGGNAAR GAYCCNGCNG TNATHMGN 

40 

Peptide mute 2 

SEQ ID N** 72 YSLPKSEFA V PDLELP 

45 SEQ ID N*67 TAYWSNYTNC CNAARWSNGA RTTYGCNGTN CCNGA YYTNG ARYTNCCN 

SEQ ID N*» 69 > NAME - 'Reverse-Translation of PERLECAN* : TYPE = DNA 
GAYGCNCCNGGNCARTAYGGNGCOTAYTTYCAYGAYGAYGGmTYYTNGCmTYCCNGGN 
CAYGThnTYWSNMGhTVVSNrmJCCNGARGTNCCNGARACNATHGARYTNGARGTh^ 
50 WSNACNGC^WSNGG^m^^^yT^r^n^^TGGCARGGNGTNGARGTNGGNGARGCNGGNCA^ 
AARGAYTTYATHWShryTNGGNYTNCARGAYGGNCAYYTNGTOTTYMGOTAYC^ 
WSNGGNGARGCNMGNYTNGTNWSNGARGAYCCNATHAAYGAYGGNGARTGGCAYMGNGT 
NACNGCNrni^GNGARGGNMGNMGNGGNWSNMGNCARGTNGAYGGNGARGARYTNG^ 
WSNGGNMGNWSNCCNGGNCCNAAYGTNGCNGTNAAYGCNAARGGNWSNGTNTAYATHGG 
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•1/ 

9. Utilisation selon la revendication 8, caracterisee en ce que ledit fragment 
nucleotidique code pour ladite proteine. 

10. Utilisation selon la revendication 9, caracterisee en ce que la sequence 
5 peptidique de ladite proteine a Tetat natif consiste en une sequence choisie parmi Tune 

quelconque des SEQ ID N° 1 a 8 et SEQ ID N° 10 a 29 et les sequences peptidiques ou 
les fragments desdites sequences appartenant a une meme famille de proteines choisies 
parmi le perlecan, le precurseur de la proteine plasmatique de liaison au retinol, du 
precurseur de Tactivateur du ganglioside GM2, de la calgranuline B et de la saposine B. 

10 

11. Utilisation d'au moins un fragment nucleotidique pour obtenir une 
composition diagnostique, pronostique, prophylactique ou therapeutique destinee a 
detecter, pronostiquer, prevenir ou traiter un etat pathologique associ6 a une maladie 
degenerative et/ou neurologique et/ou auto-immune selon laquelle ledit fragment est un 

15 fragment d'une sequence nucleique choisie parmi I'une quelconque des SEQ ID N° 30, 
SEQ ID N° 3 1, SEQ ID N° 32, SEQ ID N° 33, SEQ ID N° 34, SEQ ID N° 35, SEQ ID 
N° 36, SEQ ID N° 37, SEQ ID N'^ 38, SEQ ID N° 39, SEQ ID N° 40, SEQ ID N° 41, 
SEQ ID N° 42, SEQ ID NM3, SEQ ID N° 44, SEQ ID N° 45, SEQ ID N° 46 et SEQ 
ID N° 47, SEQ ID N° 48, SEQ ID N*=* 49 et SEQ ID N° 50, SEQ ID N° 5 1, SEQ ID N° 

20 52, SEQ ID 53, SEQ ID N° 54, SEQ ID N*' 55, SEQ ID N° 56, SEQ ID N** 57, 
SEQ ID N° 67, SEQ ID N** 66, SEQ ID N** 69, SEQ ID N*^ 70 et SEQ ID N° 71 et leurs 
sequences compl^mentaires. 

12. Utilisation d'un ligand specifique d'un polypeptide ou d'un fragment 
25 nucleotidique selon Tune quelconque des revendications precedentes pour obtenir une 

composition diagnostique, pronostique, prophylactique ou therapeutique destinee a 
detecter, pronostiquer, prevenir ou traiter un etat pathologique associe a une maladie 
degenerative et/ou neurologique et/ou auto-immune. 



21. Procede selon Tune quelconque des revendtcations 14 a 20, caracterise 
en ce que la maladie degenerative et/ou auto-immune est la sclerose en plaques. 

22. Polypeptide caracterise en ce qu'il comprend au moins un fragment 
5 d'une proteine dont la s6quence peptidique correspond a SEQ ID N** 9, ledit fragment 

comprenant au moins une mutation par rapport a la sequence de reference SEQ ID N** 8. 

23. Polypeptide selon la revendication 22, caracterise en ce qu'il comprend 
au moins deux mutations par rapport a la sequence de reference SEQ ID N** 8. 

10 

24. Polypeptide selon la revendication 22, caracterise en ce qu'il est choisi 
parmi les polypeptides qui comprennent la sequence en acides amines 
FSWDNCFEGKDPAVIR, referencee SEQ ID N° 68 et la sequence en acides amines 
YSLPKSEFAVPDLELP, referencee SEQ ID N** 72. 

15 

25. Polypeptide selon Tune des revendications 22 a 24, caracterise en ce 
qu*il comprend une proteine dont la sequence peptidique correspond a SEQ ID N° 9. 

26. Polypeptide selon Tune des revendications 22 a 25, caracterise en ce 
20 qu'il consiste en une proteine dont la sequence peptidique correspond a SEQ ID N** 9. 

27. Utilisation d'au moins un polypeptide selon Tune quelconque des 
revendications 22 a 26 pour obtenir une composition diagnostique, pronostique, 
prophylactique ou therapeutique destinee a detecter, pronostiquer, prevenir ou traiter un 

25 ^tat pathologique associe a une maladie degenerative et/ou neurologique et/ou auto- 
immune. 

28. Utilisation selon la revendication 26, caracterisee en ce que le 
polypeptide tel que defini dans Tune quelconque des revendications 22 a 26 est utilise en 

30 melange avec au moins un polypeptide tel que defmi dans I'une quelconque des 
revendications 1 a 5. 
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70 % d'identite de preference au moins 80 % d'identite et avantageusement au moins 98 
d'identite avec I'une quelconque des sequences peptidiques SEQ ID N° 1 a 29, et les 
sequences peptidiques ou les fragments desdites sequences appartenant a une meme 
famille de proteines choisies parmi le perlecan, le precurseur de la proteine plasmatique 
5 de liaison au retinol, du precurseur de Tactivateur du ganglioside GM2, de la 
calgranuiine B et de la saposine B. 

50. Utilisation selon la revendication 49, caracterisee en ce que les 
polypeptides sont choisis parmi SEQ ID N** 2, 4, 8. 9, 17, 24. 

10 

51 XJtilisstion d'au rrsoins un frsgmcnt niiclsotidique pour tester 
Tefficacite d'un agent therapeutique pour un etat pathologique associe a une maladie 
degenerative et/ou neurologique et/ou auto-immune selon laquelle ledit fragment est un 
fragment d'une sequence nucleique choisie parmi Tune quelconque des SEQ ID N° 30, 

15 SEQ ID N° 3 1, SEQ ID N° 32. SEQ ID N° 33. SEQ ID N° 34. SEQ ID N° 35, SEQ ID 
N'' 36, SEQ ID N*' 37, SEQ ID N° 38, SEQ ID N*' 39, SEQ ID N° 40. SEQ ID N** 41, 
SEQ ID N° 42, SEQ ID N'=» 43, SEQ ED 44. SEQ ID N° 45, SEQ ID N° 46 et SEQ 
ID N° 47, SEQ ID N*' 48, SEQ ID N° 49 et SEQ ID N° 50. SEQ ID N*» 51. SEQ ID 
52, SEQ ID N** 53. SEQ ID 54, SEQ ID N** 55. SEQ ID N*» 56, SEQ ID N° 57, 

20 SEQ ID N** 66, SEQ ID N** 67. SEQ ID N° 69. SEQ ID N°70 . SEQ ID N** 71, et leurs 
sequences complementaires. 



52, Utilisation d'au moins un fragment nucleotidique pour la preparation 
d*une composition pharmaceutique destinee au traitement d*une maladie degenerative 

25 et/ou neurologique et/ou auto-immune, telle que la sclerose en plaques selon laquelle 
ledit fragment est un fragment d'une sequence nucleique choisie parmi Tune quelconque 
des SEQ ID N° 30, SEQ ID N° 3 1, SEQ ID N° 32, SEQ ID N** 33, SEQ ID N** 34, 
SEQ ID N** 35, SEQ ID N° 36. SEQ ID N° 37, SEQ ID N° 38. SEQ ED N** 39, SEQ ID 
>r 40, SEQ ID N° 41, SEQ ID N° 42, SEQ ID N° 43, SEQ ID N** 44, SEQ ID N** 45, 

30 SEQ ID N** 46 et SEQ ED N*' 47, SEQ ID N° 48, SEQ ID N*' 49 et SEQ ID N** 50, SEQ 
ID N° 51, SEQ ID N° 52, SEQ ID N'^ 53, SEQ ID N** 54. SEQ ID N** 55, SEQ ID N** 



132 



56, SEQ ID N° 57, SEQ ID N** 66, SEQ ID N°67, SEQ ID N° 69, SEQ ID N°70 , SEQ 
ID N° 71, et leurs sequences complementaires. 

53. Utilisation selon la revendication 51 ou 52, caracterisee en ce que la 
5 sequence nucleique est choisie parmi SEQ ID N"* 30, 3 1, 42, 53. 

54. Utilisation de la lycorine pour la preparation d'une composition pour la 
prevention et/ou le traitement de maladie degenerative et/ou neurologique et/ou auto- 
immune. 



10 



Avantageusement les cinq polypeptides qui repondent a la definition precedente sont 
utilises en combinaison. 

De preference, la sequence peptidique dudit polypeptide comprend, ou 
consiste en une sequence choisie parmi Tune quelconque des SEQ ID N*^ 2, SEQ ID N° 
5 4, SEQ ID 8, SEQ ID N° 17 et SEQ ID N° 24. 

L*invention concerne encore I'utilisation d*au moins un fragment d*un des 
polypeptiques precites pour la preparation d'un peptide immunogene, ledit peptide 
comprenant tout ou partie d'au moins une des sequences referencees SEQ ID N°s 58 a 
65 et etant utilise pour la production d'anticorps monoclonaux. 

10 L' invention a egalement pour objet, T utilisation d'av moins un fragment 

nucleotidique, pour obtenir une composition diagnostinue, pronostique, prophyiactique 
ou therapeutique destinee a detecter, pronostiquer, prevenir ou iraiter un etat 
pathologique associe a une maladie degenerative et/ou auto-immune, selon laquelle ledit 
fragment nucleotidique est choisi parmi des fragments qui codent pour au moins un 

15 fragment d'une proteine, ladite proteine etant choisie parmi les proteines dont la 
sequence peptidique a Tetat natif correspond a SEQ ID N° 1 , SEQ ID N*" 2, SEQ ID N° 
3, SEQ ID 4, SEQ ID N° 5, SEQ ID N° 6, SEQ ID N° 7, SEQ ID 8, SEQ ID N° 
10, SEQ ID N<* 1 1, SEQ ID N** 12, SEQ ID N*' 13, SEQ ID N'' 14, SEQ ID N** 15, 
SEQ ID N*' 16. SEQ ID N° 17, SEQ ID N° 18, SEQ ID N° 19, SEQ ID 20, SEQ ID 

20 N** 21, SEQ ID 22, SEQ ID N° 23, SEQ ID N° 24, SEQ ID N° 25, SEQ ID N° 26, 
SEQ ID N** 27, SEQ ID 28 ET SEQ ID N° 29 et les sequences peptidiques qui 
presentent au moins 70 % d'identite, de preference au moins 80 % et avantageusement 
au moins 98 % d*identite avec Pune quelconque des sequences peptidiques ci dessus, et 
les fragments complementaires desdits fragments, et les sequences peptidiques ou les 

25 fragments desdites sequences appartenant a une meme famille de proteines choisies 
parmi le perlecan, le precurseur de la proteine plasmatique de liaison au retinol, du 
pr^curseur de I'activateur du ganglioside GM2, de la calgranuline B et de la saposine B. 
II est a la portee de J'homme du metier de determiner les sequences nucleiques des 
fragments nucleotidiques a partir des sequences peptidiques et du code genetique, ceci 

30 faisant partie de ses connaissances generates. 

Avantageusement, le fragment nucleotidique precite code pour ladite proteine. 



14 V ^ ^ 



peptidiques ou les fragments desdites sequences appartenant a une meme famille de proteines 
choisies parmi le perlecan, le precurseur de la proteine plasmatique de liaison au retinol, du 
precurseur de I'activateur du ganglioside GM2, de la calgranuline B et de la saposine B. 

De preference, i'echantillon biologique est Purine, le Uquide de cephalo- 
5 rachidien ou le serum. 

L' invention concerne egalement un nouveau polypeptide qui comprend au 
moins un fragment d'une proteine dont la sequence peptidique correspond a SEQ ID N° 
9, ledit fragment presentant au moins une mutation, en particulier au moins deux 
mutations par rapport a la sequence de reference SEQ ID N** 8. Le polypeptide est 

10 avantageusement choisi parmi les polypeptides qui comprennent la sequence en acides 
amines FSWDNCFEGKDPAVIR, referencee SEQ ID N° 68 et la sequence en acides 
amines YSLPKSEFAVPDLELP, referencee SEQ ID N° 69. 

En particulier, ledit polypeptide comprend ou consiste en SEQ ID N° 9. Ce 
polypeptide est utilise pour obtenir une composition diagnostique, pronostique, 

15 prophylactique ou therapeutique destinee a delecter, pronostiquer, prevenir ou traiter un 
etat pathologique associe a une maladie degenerative et/ou auto-immune, seul ou en 
melange avec au moins un polypeptide tel que defmi precedemment. 

L'un des objet de I'invention est egalement un fragment nucleotidique qui 
code pour le fragment de la proteine dont la sequence peptidique correspond a SEQ ID 

20 N** 9, ledit fragment de ladite proteine presentant au moins une mutation, en particulier 
deux mutations par rapport a la sequence de reference SEQ ID N° 8. Ledit fragment 
nucleotidique, en particulier, comprend ou consiste en un fragment qui code pour SEQ 
ID N° 9. Ce fragment est utilise pour obtenir une composition diagnostique, 
pronostique, prophylactique ou therapeutique destinee a detecter, prevenir ou traiter un 

25 etat pathologique associe a une maladie degenerative et/ou auto-immune, seul ou en 
melange avec au moins un fragment nucleotidique tel que defmi precedemment. 

L'invention a aussi pour objet un precede pour detecter au moins un ligand 
associe a une maladie degenerative et/ou auto-immune, dans un echantillon biologique, 
selon lequel on met en contact I'echantillon biologique avec au moins le polypeptide qui 

30 comprend ou consiste en SEQ ID N° 9 ou un melange de polypeptides comprenant ce 
polypeptide et au moins un polypeptide tel que decrit ci dessus, puis on detecte la 



formation d'un complexe ou de complexes entre le ou les polypeptides et le ou les 
ligands correspondants ; etant entendu que par ligand on entend une molecule qui 
repond aux conditions precitees. 

L'invention concerne egalement un procede pour detecter au moins le 
polypeptide reference SEQ ID N° 9 ou un fragment dudit polypeptide, ce fragment 
comprenant au moins une et de preference deux mutations par rapport a la sequence de 
refernce SEQ ID N°8, dans un echantillon biologique selon lequel on met en contact 
rechantillon biologique avec au moins un ligand specifique dudit polypeptide, puis on 
detecte la formation d*un complexe entre ledit polypeptide et ledit ligand. La definition 
de ligand correspond a celle defmie precedemment. II peut s'agir entre autres d'un 
anticorps monolonal , d*un anticorps polyclonal, d'un substrat d'activite enzymatique, 
ou d'une enzyme dont ledit polypeptide est un cofacteur, d'un recepteur. 

On peut egalement mettre en contact rechantillon biologique avec un ligand 
specifique du polypeptide reference SEQ ID N°9 et au moins un ligand specifique d'au moins un 
autre polypeptide tel que defini precedemment, puis on detecte la formation de complexes entre 
lesdits polypeptides et lesdits ligands specifiques desdits polypeptides ; etant entendu que par 
ligand on entend une molecule qui repond aux conditions decrites precedemment. 

De preference, I'echantillon biologique est Turine, le liquide de cephalo- 
rachidien ou le serum. 

Un autre objet de T invention est un fragment nucleotidique codant pour tout ou 
partie du polypeptide SEQ ID N° 9, et son utilisation pour obtenir une composition diagnostique, 
pronostique, prophylactique ou therapeutique destinee a detecter, pronostiquer, prevenir ou 
traiter un etat pathologique associe a une maladie degenerative et/ou auto-immune, 
eventuellement en association avec au moins un fragment nucleotidique tel que defini 
precedemment, et les fragments complementaires desdits fragments. 

Par fragment polypeptidique, on entend au moins tout ou partie de la 
sequence peptidique d'une proteine, en particulier un fragment polypeptique qui 
comprend environ entre 5 et 15 acides amines et plus precisement environ entre 5 et 10 
acides amines et 6 et 15 acides amines. Et par fragment nucleotidique, on entend au 
moins tout ou partie d'une sequence nucleotidique, etant entendu que par sequence 
nucleotidique, sont couvertes les sequences ADN et ARN. 



ID N° 33, SEQ ID N° 34, SEQ ID N° 35, SEQ ID N° 36, SEQ ID N° 37, SEQ ID N° 
38, SEQ ID N° 39, SEQ ID N° 40, SEQ ID N° 41, SEQ ID N° 42, SEQ ID N° 43, 
SEQ ID N° 44, SEQ ID N° 45, SEQ ID N° 46 et SEQ ID N° 47, SEQ ID N° 48, SEQ 
ID N° 49 et SEQ ID N° 50, SEQ ID N° 51, SEQ ID N° 52, SEQ ID N° 53, SEQ ID 
5 54, SEQ ID N° 55. SEQ ID N° 56. SEQ ID N° 57, SEQ ID N** 66, SEQ ID N*'67, SEQ 
ID N** 69, SEQ ID N°70 , SEQ ID N** 71, et leurs sequences complementaires. 

La sequence nucleique est de preference choisie parmi SEQ ED N° 30, 31, 

42, 53. 

10 - Utilisation de la lycorine pour la preparation d'une composition pour la 

prevention et/ou le traitement de maladie degenerative et/ou neurologique et/ou auto- 
immune. 

Par efFicacite therapeutique, on entend le benefice clinique et biologique 

15 acquis apres administration d'un agent therapeutique en vue d'une amelioration, voire 
d*une guerison de la maladie. Ce benefice se traduit entre autre par une diminution des 
signes cliniques, biologiques, et des effets pathologiques de la maladie apres une analyse 
clinique par le medecin et/ou des analyses biologiques, telles que imagerie par resonance 
magnetique, analyse des bandes oligoclonales dans le liquide cephalorachidien, analyse 

20 de potentiels evoques et le test de detection de gliotoxicite appeie bio-essai, dont le 
principe est decrit dans la demande de brevet WO 98/1 1439 precedemment citee. Cette 
diminution des signes cliniques et effets pathologiques doit entrainer un benefice pour le 
patient (Schwartz et Lazar, 1995, Elements de statistique medicate et biologique, eds 
Flammarion ; Lazar et Schwartz, 1995, Elements de statistique medicale et biologique, 

25 eds Flammarion ). La maladie etudiee de preference est la sclerose en plaques. 

On entend par composition a usage prophylactique et/ou therapeutique, 
toute composition qui comprend un agent therapeutiquement efficace. Ces agents 
therapeutiques sont capables (i) d'influencer de maniere qualitative et/ou quantitative 
Tactivite biologique et/ou la fonction des proteines d*interet identifiees dans la presente 

30 invention, de preference Tactivite gliotoxique et/ou (ii) de moduler et/ou d'inhiber 
Texpression de ces proteines et/ou (iii) de diminuer la concentration de ces proteines 
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REVENDICATIONS 

1. Utilisation d'au moins un polypeptide comprenant au moins un fragment 
5 d'une proteine pour obtenir une composition diagnostique, pronostique, prophylactique 

ou therapeutique destinee a detecter, prevenir ou trailer un etat pathologique associe a 
une maladie degenerative et/ou neurologique et/ou auto-immune, ladite proteine etant 
choisie parmi les proteines dont la sequence peptidique a Tetat natif correspond a SEQ 
ID N° 1, SEQ ID N° 2, SEQ ID N° 3, SEQ ID N° 4, SEQ ID N° 5, SEQ ID N° 6, SEQ 

10 ID N° 7, SEQ ED N*^ 8, SEQ ID N° 10, SEQ ID NM 1, SEQ ID N° 12, SEQ ID N° 13, 
SEQ ID 14, SEQ ID N= 15, SEQ ID In'' 16, SEQ ID N° 17, SEQ ID N° 18, SEQ ID 
N° 19, SEQ ID N° 20, SEQ ID N° 21, SEQ ID N*' 22, SEQ ID N° 23, SEQ ID N° 24, 
SEQ ID 25, SEQ ID N° 26, SEQ ID N° 27. SEQ ID N° 28 et SEQ ID 29, et les 
sequences peptidiques qui presentent au moins 70 % d'identite, de preference au moins 

15 80 % d'identite et avantageusement au moins 98 % d'identite avec Tune quelconque des 
sequences peptidiques SEQ ID N° 1 a SEQ ID N° 8 et SEQ ID N° 10 a SEQ ID N° 29, 
et les sequences peptidiques ou les fragments desdites sequences appartenant i une 
meme famille de proteines choisies parmi le perlecan, le precurseur de la proteine 
plasmatique de liaison au retinol, du precurseur de i*activateur du ganglioside GM2, de 

20 la calgranuline B et de la saposine B. 

2. Utilisation d'au moins deux polypeptides en combinaison, lesdits 
polypeptides comprenant chacun au moins un fragment d'une proteine, pour obtenir une 
composition diagnostique, pronostique, prophylactique ou therapeutique destinee a 

25 detecter, prevenir ou trailer un etat pathologique associe a une maladie degenerative 
et/ou neurologique et/ou auto-immune, ladite proteine etant choisie parmi les proteines 
dont la sequence peptidique a I'etat natif correspond a une sequence peptidique choisie 
parmi SEQ ID N** 1 a SEQ ID N° 8 et SEQ ID N° 10, SEQ ID N° 29, et les sequences 
peptidiques qui presentent au moins 70 % d*identite, de preference au moins 80 % 

30 d'identite et avantageusement au moins 98 % d'identite avec Tune quelconque des 
sequences peptidiques SEQ ID N° 1 a SEQ ID N° 8 et SEQ ID N° 10 a SEQ ID N° 29, 



86 



et les sequences peptidiques ou les fragments desdites sequences appartenant a une 
meme famille de proteines choisies parmi le perlecan, le precurseur de la proteine 
plasmatique de liaison au retinol, du precurseur de I'activateur du ganglioside GM2, de 
la calgranuline B et de la saposine B. 

3. Utilisation d*au moins un polypeptide comprenant au moins un fragment 
d'une proteine pour obtenir une composition diagnostique, pronostique, prophyiactique 
ou therapeutique destinee a detecter, prevenir ou traiter un etat pathologique associe a 
une maladie degenerative et/ou neurologique et/ou auto-immune, ladite proteine etant 
choisie parmi les proteines dont la sequence peptidique a Tetat natif correspond a SEQ 
ID N° 2, SEQ ID N° 4, SEQ ID 8, SEQ ID N° 1 7 et SEQ ID N° 24 et les sequences 
peptidiques qui presentent au moins 70 % d'identite, de preference au moins 80 % 
d*identite et avantageusement au moins 98 % d'identite avec Tune quelconque des 
sequences peptidiques SEQ ID N° 2, SEQ ID N° 4. SEQ ID N° 8, SEQ ID N° 17 et 
SEQ ID N° 24. 

4. Utilisation selon la revendication 3, de cinq polypeptides en 
combinaison, lesdits polypeptides comprenant chacun au moins un fragment d'une 
proteine, pour obtenir une composition diagnostique, pronostique, prophyiactique ou 
therapeutique destinee a detecter, pronostiquer, prevenir ou traiter un etat pathologique 
associe a une maladie degenerative et/ou neurologique et/ou auto-immune, ladite 
proteine etant choisie parmi les proteines dont la sequence peptidique a I'etat natif 
correspond a SEQ ID N° 2, SEQ ID N° 4, SEQ ID N° 8, SEQ ID N° 17 et SEQ ID N** 
24 et les sequences peptidiques qui presentent au moins 70 % d'identite, de preference 
au moins 80 % d'identite et avantageusement au moins 98 % d'identite avec Tune 
quelconque des sequences peptidiques SEQ ID N° 2,. SEQ ID N° 4, SEQ ID N° 8, SEQ 
IDN° 17 et SEQIDN° 24. 

5. Utilisation selon Tune quelconque des revendications 1 a 4, caracterisee 
en ce que la sequence peptidique dudit polypeptide comprend une sequence choisie 
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parmi Tune quelconque des SEQ ID N° 2, SEQ ID N° 4, SEQ ID N° 8, SEQ ID N° 17 
et SEQ ID N° 24, 

6. Utilisation selon Tune quelconque des revendications 1 a 4, caracterisee 
5 en ce que la sequence peptidique dudit polypeptide consiste en une sequence choisie 

parmi Tune quelconque des SEQ ID N° 2, SEQ ID N° 4, SEQ ID N° 8, SEQ ID N° 17 
et SEQ ID N° 24. 

7. Utilisation d'un fragment polypeptidique defmi dans la revendication 1 
10 ou dans la revendication 3 pour la preparation d'un peptide immunogene, caracterise en 

ce que ledit peptide comprend tout ou partie d'au moins une des sequences referencee 
SEQ ID N° 58 a 65. 

8. Utilisation d'au moins un fragment nucleotidique, pour obtenir une 
15 composition diagnostique, pronostique, prophylactique ou therapeutique destinee a 

detecter, pronostiquer, prevenir ou trailer un etat pathologique associe a une maladie 
degenerative et/ou neurologique et/ou auto-immune, selon laquelle ledit fragment 
nucleotidique est choisi parmi des fragments qui cedent pour au moins un fragment 
d'une proteine, ladite proteine etant choisie parmi les proteines dent la sequence 

20 peptidique a Tetat natif correspond a SEQ ID N° 1, SEQ ID 2, SEQ ID N° 3, SEQ 
ID 4. SEQ ID N° 5, SEQ ID N'^ 6, SEQ ID N° 7, SEQ ID N° 8. SEQ ID N*' 10, 
SEQ ID N** 1 1, SEQ ID N° 12, SEQ ID N° 13, SEQ ID N* 14, SEQ ID N° 15, SEQ ID 
N° 16, SEQ ID N° 17, SEQ ID N° 18, SEQ ID N° 19, SEQ ID 20, SEQ ID N° 21. 
SEQ ID N° 22, SEQ ID N° 23, SEQ ID N° 24, SEQ ID 25, SEQ ID N° 26, SEQ ID 

25 N° 27, SEQ ID N° 28 et SEQ ID N° 29 et les sequences peptidiques qui presentent au 
moins 70 % d*identite, de preference au moins 80 % et avantageusement au moins 98 % 
d'identite avec Tune quelconque des sequences peptidiques SEQ ID N° 1 a SEQ ID W* 
8 et SEQ ID N° 10 a 29, les fragments complementaires desdits fragments et les 
fragments qui codent pour les sequences peptidiques ou les fragments desdites 

30 sequences appartenant a une meme famille de proteines choisie parmi le perlecan, le 



precurseur de la proteine plasmatique de liaison au retinol, du precurseur de Tactivateur 
du ganglioside GM2, de la calgranuline B et de la saposine B. 

9. Utilisation selon la revendication 8, caract^risee en ce que ledit fragment 
5 nucleotidique code pour ladite proteine. 

10. Utilisation selon la revendication 9, caracterisee en ce que la sequence 
peptidique de ladite proteine a Tetat natif consiste en una sequence choisie parmi I'une 
quelconque des SEQ ID N° 1 a 8 et SEQ ID N"" 10 a 29 et les sequences peptidiques ou 

10 les fragments desdites sequences appartenant a une meme famille de proteines choisies 
parmi le perlecan, le precurseur de la proteine plasmatique de liaison au retinol, du 
precurseur de I'activateur du ganglioside GM2, de la calgranuline B et de la saposine B. 

11. Utilisation d'au moins un fragment nucleotidique pour obtenir une 
15 composition diagnostique, pronostique, prophylactique ou therapeutique destinee a 

detecter, pronostiquer, prevenir ou traiter un etat pathologique associe a une maladie 
degenerative et/ou neurologique et/ou auto-immune selon laquelle ledit fragment est un 
fragment d'une sequence nucleique choisie parmi I'une quelconque des SEQ ID N° 30, 
SEQ ID N° 31, SEQ ID N° 32, SEQ ID N° 33, SEQ ID N° 34, SEQ ID N° 35, SEQ ID 

20 N° 36, SEQ ID N° 37, SEQ ID N° 38, SEQ ID N*" 39, SEQ ID N° 40, SEQ ID N° 41, 
SEQ ID N° 42, SEQ ID N° 43, SEQ ID N° 44, SEQ ID N° 45, SEQ ID N° 46 et SEQ 
ID N° 47, SEQ ID N° 48, SEQ ID N° 49 et SEQ ID N° 50, SEQ ID N° 5 1, SEQ ED N° 
52, SEQ ID N° 53, SEQ ID N° 54, SEQ ID N° 55, SEQ ID N° 56, SEQ ID N° 57, 
SEQ ID N° 67, SEQ ID N° 68, SEQ ID N° 69, SEQ ID N'* 70 et SEQ ID N*' 71 et leurs 

25 sequences complementaires. 

12. Utilisation d'un ligand specifique d'un polypeptide ou d'un fragment 
nucleotidique selon Tune quelconque des revendications precedentes pour obtenir une 
composition diagnostique, pronostique, prophylactique ou therapeutique destinee a 

30 detecter, pronostiquer, prevenir ou traiter un etat pathologique associe a une maladie 
degenerative et/ou neurologique et/ou auto-immune. 



13. Utilisation selon Tune quelconque des revendi cations precedentes, 
caracterisee en ce que la maladie degenerative et/ou auto-immune est la sclerose en 
plaques. 

5 

14. Procede pour detector au moins una proteine associee a une maladie 
degenerative et/ou auto-immune, dans un echantillon biologique, caracterise en ce que 
Ton met en contact rechantillon biologique avec au moins un ligand specifique d'au 
moins un polypeptide, ledit polypeptide comprenant au moins un fragment d'une 

10 proteine et ladite proteine etant choisie parmi les proteines dont la sequence peptidique a 
Fetat natif correspond a SEQ ID 1. SEQ ID 2, SEQ ID 3, SEQ ID N° 4. SEQ 
ID N'' 5, SEQ ID N° 6, SEQ ID N** 7, SEQ ID N*' 8, SEQ ID 10, SEQ ID 1 1, 
SEQ ID N*^ 12. SEQIDN° 13, SEQ ID N** 14, SEQ ID N° 15, SEQIDN° 16. SEQ ID 
N° 17, SEQ ID N° 18, SEQ ID N° 19, SEQ ID N*^ 20, SEQ ID N° 21, SEQ ID 22, 

15 SEQ ID N° 23, SEQ ID N" 24, SEQ ID N° 25, SEQ ID N** 26, SEQ ID U° 27. SEQ ID 
N° 28 et SEQ ID N° 29 et les sequences peptidiques qui presentent au moins 70 % 
d'identite de preference au moins 80 % d'identite et avantageusement au moins 98 
d'identite avec Tune quelconque des sequences peptidiques SEQ ID N° 1 a SEQ ID N° 
8 et SEQ ID N"" 10 a 29, et les sequences peptidiques ou les fragments desdites 

20 sequences appartenant a une meme famille de proteines choisies parmi le perlecan, le 
precurseur de la proteine plasmatique de liaison au retinol, du precurseur de Tactivateur 
du ganglioside GM2, de la calgranuline B et de la saposine B, puis on detecte la 
formation d*un complexe entre ledit polypeptide et ledit ligand. 

25 15. Procede selon la revendication 14, caracterise en ce que ledit ligand est 

un anticorps monoclonal, un anti corps polyclonal, un recepteur, un substrat d'activite 
enzymatique ou une enzyme dont ledit polypeptide est un cofacteur. 

16. Procede pour detecter au moins un ligand associe a une maladie 
30 degenerative et/ou auto-immune, dans un echantillon biologique, caracterise en ce que 
Ton met en contact I'echantillon biologique avec au moins un polypeptide comprenant 
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au moins un fragment d'une proteine, ladite proteine etant choisie parmi les proteines 
dont la sequence peptidique a I'etat natif correspond a SEQ ID N° 1, SEQ ID N° 2, 
SEQ ID N° 3, SEQ ID N° 4, SEQ ID N° 5 SEQ ID 6, SEQ ID 7, SEQ ID N° 8, 
SEQ ID N° 10, SEQ ID NM I, SEQ ID N** 12, SEQ ID N° 13, SEQ ID 14, SEQ ID 
5 N° 15, SEQ ID 16, SEQ ID 17, SEQ ID 18, SEQ ID N° 19. SEQ ID N° 20, 
SEQ ID N° 21, SEQ ID N° 22, SEQ ID N° 23, SEQ ID N° 24, SEQ ID N° 25, SEQ ID 
N*^ 26, SEQ ID N° 27, SEQ IDN° 28 et SEQ ID N° 29. les sequences peptidiques qui 
presentent au moins 70 % d'identite, de preference au moins 80 % d'identite et 
avantageusement au moins 98 % d'identite avec i'une quelconque des sequences 

10 peptidiques SEQ ID N° 1 a SEQ ID N° 8 et SEQ ID N*' 10 a SEQ ID N° 29, et les 
sequences peptidiques ou les fragments desdites sequences appartenant a une meme 
famille de proteines choisie parmi le perlecan, le precurseur de la proteine plasmatique 
de liaison au retinol, du precurseur de Tactivateur du ganglioside GM2, de la 
calgranuline B et de la saposine B, puis on detecte la formation d'un complexe entre 

15 ledit polypeptide et ledit figand. 

17. Procede selon la revendication 16, caracterise en ce que le ligand est un 
anticorps, un recepteur, un substrat d'activite enzymatique ou une enzyme dont ledit 
polypeptide est un cofacteur. 

20 

18. Procede selon I'une quelconque des revendications 14 a 17, caracterise 
en ce que la sequence dudit polypeptide comprend une sequence peptidique choisie 
parmi Tune quelconque des SEQ ID N° 1 a 8 et SEQ ID N"* 10 a 29. 

25 19. Precede selon Tune quelconque des revendications 14 a 17, caracterise 

en ce que la sequence dudit polypeptide consiste en une sequence peptidique choisie 
parmi i'une quelconque des SEQ ID N° 1 a 8 et SEQ ID N** 1 0 a 29. 



30 



20. Procede selon I'une quelconque des revendications 14 a 19, caracterise 
en ce que Techantillon biologique est 1 'urine, le liquide cephalo-rachidien ou le serum. 
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21. Precede selon I'une quelconque des revendications 14 a 20, caracterise 
en ce que la maladie degenerative et/ou auto-immune est la sclerose en plaques. 

22. Polypeptide caracterise en ce qu'il comprend au moins un fragment 
5 d'une proteine dont la sequence peptidique correspond a SEQ ID N° 9, ledit fragment 

comprenant au moins une mutation par rapport a la sequence de reference SEQ ID N*' 8. 

23. Polypeptide selon la revendication 22, caracterise en ce qu'il comprend 
au moins deux mutations par rapport a la sequence de reference SEQ ID N° 8. 

10 

24. Polypeptide selon !a revendication 22, caracterise en ce qu'il est choisi 
parmi les polypeptides qui comprennent la sequence en acides amines 
FSWDNCFEGKDPAVIR, referencee SEQ ID N*' 68 et la sequence en acides amines 
YSLPKSEFAVPDLELP, referencee SEQ ID 69, 

15 

25. Polypeptide selon Tune des revendications 22 a 24, caracterise en ce 
qu'il comprend une proteine dont la sequence peptidique correspond a SEQ ID N° 9. 

26. Polypeptide selon Tune des revendications 22 a 24, caracterise en ce 
20 qu'il consiste en une proteine dont la sequence peptidique correspond a SEQ ID N° 9. 

27. Utilisation d*au moins un polypeptide selon Tune quelconque des 
revendications 22 a 26 pour obtenir une composition diagnostique, pronostique, 
prophylactique ou therapeutique destinee a detecter, pronostiquer, prevenir ou traiter un 

25 etat pathologique associe a une maladie degenerative et/ou neurologique et/ou auto- 
immune. 

28. Utilisation selon la revendication 27, caracterisee en ce que le 
polypeptide tel que defini dans Tune quelconque des revendications 22 a 26 est utilise en 

30 melange avec au moins un polypeptide tel que defini dans Tune quelconque des 
revendications 1 a 5. 
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29. Precede pour detecter au moins un ligand associe a une maladie 
degenerative et/ou auto-immune, dans un echantillon biologique, caracterise en ce que 
Von met en contact I 'echantillon biologique avec au moins un polypeptide tel que defmi 

5 dans Tune quelconque des revendications 22 a 26, puis on detecte la formation d'un 
complexe entre ledit polypeptide et le ligand. 

30. Procede selon la revendication 29, caracterise en ce que Ton met en 
contact I'echantillon biologique avec un polypeptide tel que defmi dans Tune quelconque 

10 des revendications 22 a 26 et avec au moins un polypeptide tel que defini dans Tune 
quelconque des revendications 1 a 5. 

31. Procede selon la revendication 29 ou 30, caracterise en ce que ledit 
ligand est un anticorps, un recepteur, un substrat d'activite enzymatique ou une enzyme 

15 dont ledit polypeptide est un cofacteur. 

32. Procede pour detecter au moins un polypeptide tel que defmi dans Tune 
quelconque des revendications 22 a 26 dans un echantillon biologique caracterise en ce 
que Ton met en contact I'echantillon biologique avec au moins un ligand specifique 

20 dudit polypeptide, puis on detecte la formation d'un complexe entre ledit polypeptide et 
ledit ligand. 

33. Procede selon la revendication 32, caracterise en ce que ledit ligand est 
anticorps monoclonal, un anticorps polyclonal, un recepteur, un substrat d'activite 

25 enzymatique ou une enzyme dont ledit polypeptide est un cofacteur. 

34. Procede selon la revendication 32 ou 33, caracterise en ce que Ton met 

en contact Fechantillon biologique avec un ligand tel que defini dans Tune quelconque 
des revendications 31 et 33 et au moins un ligand specifique d'au moins un polypeptide 
30 tel que defmi dans Pune quelconque des revendications I a 5, puis on detecte la 



93 



formation de complexes entre lesdits polypeptides et lesdits ligands specifiques desdits 
polypeptides. 

35. Procede selon la revendication 34, caracterise en ce que le ligand est un 
anticorps monoclonal, un anti corps polyclonal, un recepteur, un substrat d'activite 
enzymatique ou une enzyme dont ledit polypeptide est un cofacteur. 

36. Fragment nucleotidique caracterise en ce qu'il code pour un 
polypeptide tel que defini dans Tune quelconque des revendications 22 a 26. 



37. Utilisitlloii u'un fragment nucleotidique pour obtenir une composition 
diagnostique, pronostique, prophyiactique ou therapeutique destinee a detecter, 
pronostiquer, prevenir ou traiter un etat pathoiogique associe a une maladie 
degenerative et/ou auto-immune, selon laquelle ledit fragment nucleotidique est le 
fragment nucleotidique defini dans la revendication 36, eventuellement en association 
avec au moins un fragment nucleotidique tel que defini dans Tune quelconque des 
revendications 8 a 11 , et les fragments complementaires desdits fragments. 

38. Procede selon Tune quelconque des revendications 29 a 35, caracterise 
en ce que Techantillon biologique est Turine, ie liquide cephalo-rachidien ou le serum. 

39. Procede selon Tune quelconque des revendications 29 a 35 caracterise 
en ce que la maladie degenerative et/ou auto-immune est la sclerose en plaques. 

40. Procede pour detecter au moins un polypeptide tel que defini dans Tune 
quelconque des revendications 1 a 5 ou dans Tune quelconque des revendications 22 a 
26, selon lequel on preleve un echantillon d'un fluide biologique d*un patient presentant 
un etat pathoiogique associe a une maladie degenerative et/ou neurologique et/ou auto- 
immune et eventuellement apres purification dudit echantillon de fluide biologique, on 
analyse par spectrometrie de masse le profil de masse obtenu a partir du fluide 
biologique et on compare a un profil de masse de reference. 



FEUILLE RECnWfil 



41. Utilisation d'au moins un polypeptide comprenant au moins un 
fragment d'une proteine pour tester Tefficacite d*un agent therapeutique, ladite proteine 
etant choisie parmi las proteines dont la sequence peptidique a I'etat natif correspond a 
SEQ ID NM. SEQ ID N° 2, SEQ ID 3, SEQ ID N° 4, SEQ ID N° 5, SEQ ID N° 6, 
SEQ ID N° 7. SEQ ID N° 8, SEQ ID N° 9, SEQ ID N° 10, SEQ ID NM 1, SEQ ID N° 
12, SEQ ID N« 13, SEQ ID N° 14, SEQ ID N° 15, SEQ ID N° 16, SEQ ID 17, 
SEQ ID N° 18, SEQ ID NM9, SEQ ID N° 20, SEQ ID 21, SEQ ID N° 22, SEQ ID 
23, SEQ ID N« 24, SEQ ID N° 25, SEQ ID N° 26, SEQ ID N° 27, SEQ ID N° 28 et 
SEQ ID N° 29, les sequences peptidiques qui presentent au moins 70 % d'identite de 
preference au moins 80 % d'identite et avantageusement au moins 98 d'identite avec 
Tune quelconque des sequences peptidiques SEQ ID N*' 1 a 29, et les sequences 
peptidiques ou les fragments desdites sequences appartenant a une meme famille de 
proteines choisie parmi le perlecan, le precurseur de la proteine plasmatique de liaison au 
retinol, du precurseur de Tactivateur du ganglioside GM2, de la calgranuiine B et de la 
saposine B. 

42. Utilisation d'au moins un polypeptide comprenant au moins un 
fragment d'une proteine pour la preparation d'une composition pharmaceutique destinee 
au traitement d'une maladie degenerative et/ou neurologique et/ou auto-immune, telle 
que la sclerose en plaques, ladite proteine etant choisie parmi les proteines dont la 
sequence peptidique a l*etat natif correspond a SEQ ID N° 1, SEQ ID N° 2, SEQ ID N** 
3, SEQ ID N** 4, SEQ ID N° 5, SEQ ID N** 6, SEQ ID N° 7, SEQ ID N° 8, SEQ ID 
9, SEQ ID N° 10, SEQ ID N° 11, SEQ ID N° 12, SEQ ID N° 1 3, SEQ ID N** 14, SEQ 
ID N*' 15, SEQ ID N° 16, SEQ ID N*' 17, SEQ ID N*' 18, SEQ ID N° 19, SEQ ID N** 
20, SEQ ID N*' 21. SEQ ID 22, SEQ ID N*» 23, SEQ ID N** 24, SEQ ID N° 25, 
SEQ ID N** 26, SEQ ID N° 27, SEQ ID N° 28 et SEQ ID N° 29, les sequences 
peptidiques qui presentent au moins 70 % d'identite de preference au moins 80 % 
d'identite et avantageusement au moins 98 d'identite avec I'une quelconque des 
sequences peptidiques SEQ ID N° I a 29, et les sequences peptidiques ou les fragments 
desdites sequences appartenant a une meme famille de proteines choisie parmi le 



perlacan, le precurseur de la proteine plasmatique de liaison au retinol, du precurseur de 
l*activateur du ganglioside GM2, de la calgranuline et de la saposine. 

43. Utilisation scion la revendication 41 ou 42, caracterisee en ce que le 
5 polypeptide est choisi parmi SEQ ID N° 2, 4,8, 9, 17, 24. 

44. Utilisation d'au moins un fragment nucleotidique, pour tester 
TefFicacite d'un agent therapeutique pour un etat pathologique associe a une maladie 
degenerative et/ou neurologique et/ou auto-immune, selon laquelle ledit fragment 

10 nucleotidique est choisi parmi les fragments qui codent pour au moins un fragment 
d*une proteine, ladite proteine etant choisie parmi les proteines dont la sequence 
peptidique a Tetat natif correspond a SEQ ID N° 1, SEQ ID 2, SEQ ID N° 3, SEQ 
ID N° 4, SEQ ID N° 5, SEQ ID N° 6, SEQ ID N° 7, SEQ ID N« 8, SEQ IDN° 9, SEQ 
ID N° 10, SEQ ID N° 1 1, SEQ ID N° 12, SEQ ID N'' 13, SEQ ID N° 14, SEQ ID N** 

15 15, SEQ ID 16, SEQ ID N° 17, SEQ ID N° 18, SEQ ID N° 19, SEQ ID N° 20, 
SEQ ID 21, SEQ ID N° 22, SEQ ID N° 23, SEQ ID N** 24, SEQ ID N** 25. SEQ ID 
26, SEQ ID N° 27, SEQ ID N° 28 et SEQ ID N** 29, les sequences peptidiques qui 
presentent au moins 70 % d'identite, de preference au moins 80 % et avantageusement 
au moins 98 % d'identite avec Tune quelconque des sequences peptidiques SEQ ID N° 

20 1 a 29, et les fragments complementaires desdits fragments et les fragments qui codent 
pour les sequences peptidiques ou les fragments desdites sequences appartenant a une 
meme famille de proteines choisie parmi le perlecan, le precurseur de la proteine 
plasmatique de liaison au retinol, du precurseur de I'activateur du ganglioside GM2, de 
la calgranuline B et de la saposine B. 

25 

45. Utilisation pour tester TefTicacite d'un agent therapeutique pour un 
etat pathologique associe a une maladie degenerative et/ou neurologique et/ou auto- 
immune, de proteines recombinantes et/ou codecs par tout ou partie des fragments 
nucleotidiques defmis a la revendication 44. 

30 
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46. Utilisation d*au moins un fragment nucleotidique pour la preparation 
d'une composition pharmaceutique destinee au traitement d'une maladie degenerative 
et/ou neurologique et/ou auto-immune, telle que la sclerose en plaques, selon laquelle 
ledit fragment nucleotidique est choisi parmi des fragments qui codent pour au moins un 
5 fragment d'une proteine, ladite proteine etant choisie parmi les proteines dont la 
sequence peptidique a Petat natif correspond a SEQ ID N*" 1, SEQ ID N° 2, SEQ ID N** 
3, SEQ ID N° 4, SEQ ID N° 5, SEQ ID N° 6, SEQ ID N° 7, SEQ ID N'' 8, SEQ IDN** 
9, SEQ ID N° 10, SEQ ID N° 1 1, SEQ ID N° 12, SEQ ID N** 13, SEQ ID N° 14, SEQ 
ID N° 15, SEQ ID 16, SEQ ID 17, SEQ ID N° 18, SEQ ID N** 19, SEQ ID N° 

10 20, SEQ ID N*' 21, SEQ ID N** 22, SEQ ID N° 23, SEQ ID N° 24, SEQ ID N° 25, 
SEQ ID N° 26, SEQ ID N'^ 27, SEQ ID 28 et SEQ ID N° 29, les sequences 
peptidiques qui presentent au moins 70 % d'identite, de preference au moins 80 % et 
avantageu semen t au moins 98 % d'identite avec I'une quelconque des sequences 
peptidiques SEQ ID N** 1 a 29, et les fragments complementaires desdits fragments et 

IS les fragments qui codent pour les sequences peptidiques ou les fragments desdites 
sequences appartenant a une meme famille de proteines choisie parmi le perlecan, !e 
precurseur de la proteine plasmatique de liaison au retinol, du precurseur de i'activateur 
du ganglioside GM2, de la calgranuline 6 et de la saposine B. 

20 47. Utilisation pour la preparation d'une composition pharmaceutique 

destinee au traitement d'une maladie degenerative et/ou neurologique et/ou auto- 
immune, telle que la sclerose en plaques, de proteines recombinantes et/ou codecs par 
tout ou partie des fragments nucleotidiques defmis a la revendi cation 46. 

25 48, Utilisation selon la revendication 44 ou 46, caracterisee en ce que ledit 

fragment nucleotidique code pour ladite proteine. 
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49. Utilisation selon la revendication 48, caracterisee en ce que la sequence 
peptidique de ladite proteine a I'etat natif consiste en une sequence choisie parmi Tune 
quelconque des SEQ ID N° 1 a 29, les sequences peptidiques qui presentent au moins 



70 % d'identite de preference au moins 80 % d'identite et avantageusement au moins 98 
d'identite avec Tune quelconque des sequences peptidiques SEQ ID N° 1 a 29, et les 
sequences peptidiques ou les fragments desdites sequences appartenant a une meme 
famille de proteines choisies parmi le perlecan, le precurseur de la proteine plasmatique 
5 de liaison au retinol, du precurseur de Tactivateur du ganglioside GM2, de la 
calgranuline B et de la saposine B. 

50. Utilisation selon la revendication 49, caracterisee en ce que les 
polypeptides sont choisis parmi SEQ ID N° 2, 4, 8, 9, 17, 24. 

10 

51. Utilisation d*au moins un fragment nucleotidique, pour tester 
I'efficacite d'un agent therapeutique pour un etat pathologique associe a une maladie 
degenerative et/ou neurologique et/ou auto-immune selon laquelle led it fragment est un 
fragment d'une sequence nucleique choisie parmi Tune quelconque des SEQ ID N° 30, 

15 SEQ ID N** 3 1, SEQ ID N« 32, SEQ ID 33, SEQ ID N° 34, SEQ ID N° 35, SEQ ID 
N** 36. SEQ ID 37, SEQ ID N° 38, SEQ ID 39. SEQ ID N° 40, SEQ ID N° 41. 
SEQ ID N** 42, SEQ ID 43, SEQ ID N° 44, SEQ ID N° 45, SEQ ID N° 46 et SEQ 
ID N° 47, SEQ ID N° 48, SEQ ID N° 49 et SEQ ID N° 50, SEQ ID N° 51, SEQ ID N° 
52, SEQ ID N° 53, SEQ ID N° 54, SEQ ID N° 55, SEQ ID N° 56, SEQ ID N'' 57, 

20 SEQ ID N° 66, SEQ ID N° 67. SEQ ID N° 68, SEQ ID N° 69, SEQ ID N°70 , SEQ ID 
N° 71, et leurs sequences complementaires. 

52. Utilisation d*au moins un fragment nucleotidique pour la preparation 
d'une composition pharmaceutique destinee au traitement d'une maladie degenerative 

25 et/ou neurologique et/ou auto-immune, telle que la sclerose en plaques selon laquelle 
ledit fragment est un fragment d'une sequence nucleique choisie parmi I'une quelconque 
des SEQ ID N*> 30, SEQ ID N° 31, SEQ ID N** 32, SEQ ID 33, SEQ ID N*' 34, 
SEQ ID N° 35, SEQ ID N** 36, SEQ ID N° 37, SEQ ID N° 38, SEQ ID 39, SEQ ID 
N° 40, SEQ ID N° 41, SEQ ID N° 42, SEQ ID N° 43, SEQ ID N° 44, SEQ ID N"^ 45, 

30 SEQ ID N° 46 et SEQ ID N° 47, SEQ ID N° 48, SEQ ID N° 49 et SEQ ID 50, SEQ 
ID 51, SEQ ID 1SI° 52. SEQ ID 53, SEQ ID N° 54. SEQ ID N** 55, SEQ ID 
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56. SEQ ID N° 57, SEQ ID N° 66, SEQ ID N°67, SEQ ID N° 68, SEQ ID N° 69, SEQ 
ID N°70 , SEQ ID N° 71, et leurs sequences complementaires. 

53. Utilisation selon la revendication 51 ou 52, caracterisee en ce que la 
sequence nucleique est choisie parmi SEQ ID N° 30, 3 1, 42, 53. 

54. Utilisation de la lycorine pour la preparation d'une composition pour la 
prevention et/ou le traitement de maladie degenerative ei/ou neurologique et/ou auto- 
immune. 



1 



LISTE DE SEQUENCES 

<110> BIOMERIEUX STELHYS 

<120> Utilisation d'un polypeptide pour detecter, prevenir ou 
traiter un 6tat pathologique associ^ une maladie 
degenerative, neurologique ou auto- immune 

<130> SEP22 

<140> FR9909372 
<141> 1999-07-15 

<160> 72 

<170> Patentin Ver. 2.1 

<210> 1 

<211> 4393 

<212> PRT 

<213> Homo sapiens 

<400> 1 

Met Gly Trp Arg Ala Pro Gly Ala Leu Leu Leu Ala Leu Leu Leu His 
15 10 15 

Gly Arg Leu Leu Ala Val Thr His Gly Leu Arg Ala Tyr Asp Gly Leu 
20 25 30 

Ser Leu Pro Glu Asp lie Glu Thr Val Thr Ala Ser Gin Met Arg Trp 
35 40 45 

Thr His Ser Tyr Leu Ser Asp Asp Glu Asp Met Leu Ala Asp Ser He 
50 55 60 

Ser Gly Asp Asp Leu Gly Ser Gly Asp Leu Gly Ser Gly Asp Phe Gin 
65 70 75 80 

Met val Tyr Phe Arg Ala Leu Val Asn Phe Thr Arg Ser He Glu Tyr 
85 90 95 

Ser Pro Gin Leu Glu Asp Ala Gly Ser Arg Glu Phe Arg Glu Val Ser 
100 105 110 

Glu Ala Val Val Asp Thr Leu Glu Ser Glu Tyr Leu Lys He Pro Gly 
115 120 125 

Asp Gin Val Val Ser Val Val Phe He Lys Glu Leu Asp Gly Trp Val 
130 135 140 

Phe Val Glu Leu Asp Val Gly Ser Glu Gly Asn Ala Asp Gly Ala Gin 
145 150 155 160 

He Gin Glu Met Leu Leu Arg Val He Ser Ser Gly Ser Val Ala Ser 
165 170 175 

Tyr Val Thr Ser Pro Gin Gly Phe Gin Phe Arg Arg Leu Gly Thr Val 
180 185 190 
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Pro Gin Phe Pro 
195 

Tyr Asn Glu Cys 
210 

Cys Arg Asp Met 

225 

lie Ser Pro Thr 



Arg Pro Glu Thr 
260 

Gin Pro Leu Leu 
275 

Glu Ala Ala Cys 
290 

Asp Gly Gin Glu 
305 

Pro Pro Pro Pro 



Cys Ala Leu Lys 
340 

Arg Thr Asp Glu 
355 

Gly Pro Thr Gin 
370 

Ser Phe His Cys 
385 

Phe Gly Cys Met 



Gin Ala Ser Arg 
420 

Val Pro Ala Pro 

435 

Pro Ser Gin Pro 
450 

Leu lie lie Arg 
465 

Glu Ala Met Asn 



Leu Glu Leu Val 
500 



Arg Ala Cys Thr 
200 

Val Ala Leu Glu 
215 

Ser Asp Glu Leu 

230 

Phe Ser Leu Leu 
245 

Thr lie Met Arg 



Pro Gly Ser Val 
280 

Arg Asn Gly His 
295 

Asp Cys Glu Asp 
310 

Cys Glu Pro Asn 
325 

Leu Trp Arg Cys 



Ala Asn Cys Pro 
360 

Phe Arg Cys Val 

375 

Asp Glu Glu Ser 
390 

Pro Pro Gin Val 
405 

Gly Gin Thr Val 



Phe Leu lie Asn 
440 

Arg val Thr Val 
455 

Asp Val Lys Glu 
470 

Ala Arg Gly Met 
4B5 

Pro Gin Arg Ala 



Glu Ala Glu Phe 



Tyr Arg Cys Asp 
220 

Asn Cys Glu Glu 
235 

Val Glu Thr Thr 
250 

Gin Pro Pro Val 
265 

Arg Pro Leu Pro 



Cys lie Pro Arg 
300 

Gly Ser Asp Glu 
315 

Glu Phe Pro Cys 
330 

Asp Gly Asp Phe 
345 

Thr Lys Arg Pro 



Ser Thr Asn Met 

380 

Asp Cys Pro Asp 
395 

Val Thr Pro Pro 
410 

Thr Phe Thr Cys 
425 

Trp Arg Leu Asn 



Thr Ser Glu Gly 
460 

Ser Asp Gin Gly 
475 

Val Phe Gly lie 
490 

Gly Pro Cys Pro 
505 



Ala Cys His Ser 
205 

Arg Arg Pro Asp 



Pro Val Leu Gly 
240 

Ser Leu Pro Pro 
255 

Thr His Ala Pro 
270 

Cys Gly Pro Gin 
285 

Asp Tyr Leu Cys 



Leu Asp Cys Gly 
320 

Gly Asn Gly His 
335 

Asp Cys Glu Asp 
350 

Glu Glu Val Cys 
365 

Cys lie Pro Ala 



Arg Ser Asp Glu 
400 

Arg Glu Ser lie 
415 

Val Ala He Gly 
430 

Trp Gly His He 
445 

Gly Arg Gly Thr 



Ala Tyr Thr Cys 
480 

Pro Asp Gly Val 
495 

Asp Gly His Phe 
510 
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Tyr Leu Glu His Ser Ala Ala Cys Leu Pro Cys Phe Cys Phe Gly lie 
515 520 525 

Thr Ser Val Cys Gin Ser Thr Arg Arg Phe Arg Asp Gin lie Arg Leu 
530 535 540 

Arg Phe Asp Gin Pro Asp Asp Phe Lys Gly Val Asn Val Thr Met Pro 
545 550 555 560 

Ala Gin Pro Gly Thr Pro Pro Leu Ser Ser Thr Gin Leu Gin lie Asp 
565 570 575 

Pro Ser Leu His Glu Phe Gin Leu Val Asp Leu Ser Arg Arg Phe Leu 
580 585 590 

Val His Asp Ser Phe Trp Ala Leu Pro Glu Gin Phe Leu Gly Asn Lys 
595 600 605 

Val Asp Ser Tyr Gly Gly Ser Leu Arg Tyr Asn Val Arg Tyr Glu Leu 
610 615 620 

Ala Arg Gly Met Leu Glu Pro Val Gin Arg Pro Asp Val Val Leu Val 
625 630 635 640 

Gly Ala Gly Tyr Arg Leu Leu Ser Arg Gly His Thr Pro Thr Gin Pro 
645 650 655 

Gly Ala Leu Asn Gin Arg Gin Val Gin Phe Ser Glu Glu His Trp Val 
660 665 670 

His Glu Ser Gly Arg Pro Val Gin Arg Ala Glu Leu Leu Gin Val Leu 
675 680 685 

Gin Ser Leu Glu Ala Val Leu lie Gin Thr Val Tyr Asn Thr Lys Met 
690 695 700 

Ala Ser Val Gly Leu Ser Asp lie Ala Met Asp Thr Thr Val Thr His 
705 710 715 720 

Ala Thr Ser His Gly Arg Ala His Ser Val Glu Glu Cys Arg Cys Pro 
725 730 735 

lie Gly Tyr Ser Gly Leu Ser Cys Glu Ser Cys Asp Ala His Phe Thr 
740 745 750 

Arg Val Pro Gly Gly Pro Tyr Leu Gly Thr Cys Ser Gly Cys Ser Cys 
755 760 765 

Asn Gly His Ala Ser Ser Cys Asp Pro Val Tyr Gly His Cys Leu Asn 
770 775 780 

Cys Gin His Asn Thr Glu Gly Pro Gin Cys Lys Lys Cys Lys Ala Gly 
785 790 795 800 

Phe Phe Gly Asp Ala Met Lys Ala Thr Ala Thr Ser Cys Arg Pro Cys 
805 810 815 



Pro Cys Pro Tyr lie Asp Ala Ser Arg Arg Phe Ser Asp Thr Cys Phe 
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820 825 830 

Leu Asp Thr Asp Gly Gin Ala Thr Cys Asp Ala Cys Ala Pro Gly Tyr 
835 840 845 

Thr Gly Arg Arg Cys Glu Ser Cys Ala Pro Gly Tyr Glu Gly Asn Pro 
850 855 860 

lie Gin Pro Gly Gly Lys Cys Arg Pro Val Asn Gin Glu lie Val Arg 
865 870 875 880 

Cys Asp Glu Arg Gly Ser Met Gly Thr Ser Gly Glu Ala Cys Arg Cys 
885 890 895 

Lys Asn Asn Val Val Gly Arg Leu Cys Asn Glu Cys Ala Asp Arg Ser 
900 905 910 

Phe His Leu Ser Thr Arg Asn Pro Asp Gly Cys Leu Lys Cys Phe Cys 
915 920 925 

Met Gly Val Ser Arg His Cys Thr Ser Ser Ser Trp Ser Arg Ala Gin 
930 935 940 

Leu His Gly Ala Ser Glu Glu Pro Gly His Phe Ser Leu Thr Asn Ala 
945 950 955 960 

Ala Ser Thr His Thr Thr Asn Glu Gly lie Phe Ser Pro Thr Pro Gly 
965 970 975 

Glu Leu Gly Phe Ser Ser Phe His Arg Leu Leu Ser Gly Pro Tyr Phe 
980 985 990 

Trp Ser Leu Pro Ser Arg Phe Leu Gly Asp Lys Val Thr Ser Tyr Gly 
995 1000 1005 

Gly Glu Leu Arg Phe Thr Val Thr Gin Arg Ser Gin Pro Gly Ser Thr 
1010 1015 1020 

Pro Leu His Gly Gin Pro Leu Val Val Leu Gin Gly Asn Asn lie lie 
1025 1030 1035 1040 

Leu Glu His His Val Ala Gin Glu Pro Ser Pro Gly Gin Pro Ser Thr 
1045 1050 1055 

Phe lie Val Pro Phe Arg Glu Gin Ala Trp Gin Arg Pro Asp Gly Gin 
1060 1065 1070 

Pro Ala Thr Arg Glu His Leu Leu Met Ala Leu Ala Gly lie Asp Thr 
1075 1080 1085 

Leu Leu lie Arg Ala Ser Tyr Ala Gin Gin Pro Ala Glu Ser Arg Val 
1090 1095 1100 

Ser Gly lie Ser Met Asp Val Ala Val Pro Glu Glu Thr Gly Gin Asp 
1105 1110 1115 1120 



Pro Ala Leu Glu Val Glu Gin Cys Ser Cys Pro Pro Gly Tyr Arg Gly 
1125 1130 1135 



Pro Ser Cys Gin Asp Cys Asp Thr Gly Tyr Thr Arg Thr Pro Ser Gly 
1140 1145 1150 



Leu Tyr Leu Gly Thr Cys Glu Arg Cys Ser Cys His Gly His Ser Glu 
1155 1160 1165 

Ala Cys Glu Pro Glu Thr Gly Ala Cys Gin Gly Cys Gin His His Thr 
1170 1175 1180 

Glu Gly Pro Arg Cys Glu Gin Cys Gin Pro Gly Tyr Tyr Gly Asp Ala 
1185 1190 1195 1200 

Gin Arg Gly Thr Pro Gin Asp Cys Gin Leu Cys Pro Cys Tyr Gly Asp 
1205 1210 1215 

Pro Ala Ala Gly Gin Ala Ala His Thr Cys Phe Leu Asp Thr Asp Gly 
1220 1225 1230 

His Pro Thr Cys Asp Ala Cys Ser Pro Gly His Ser Gly Arg His Cys 
1235 1240 1245 

Glu Arg Cys Ala Pro Gly Tyr Tyr Gly Asn Pro Ser Gin Gly Gin Pro 
1250 1255 1260 

Cys Gin Arg Asp Ser Gin Val Pro Gly Pro lie Gly Cys Asn Cys Asp 
1265 1270 1275 1280 

Pro Gin Gly Ser Val Ser Ser Gin Cys Asp Ala Ala Gly Gin Cys Gin 
1285 1290 1295 

Cys Lys Ala Gin Val Glu Gly Leu Thr Cys Ser His Cys Arg Pro His 
1300 1305 1310 

His Phe His Leu Ser Ala Ser Asn Pro Asp Gly Cys Leu Pro Cys Phe 
1315 1320 1325 

Cys Met Gly lie Thr Gin Gin Cys Ala Ser Ser Ala Tyr Thr Arg His 
1330 1335 1340 

Leu He Ser Thr His Phe Ala Pro Gly Asp Phe Gin Gly Phe Ala Leu 
1345 1350 1355 1360 

Val Asn Pro Gin Arg Asn Ser Arg Leu Thr Gly Glu Phe Thr Val Glu 
1365 1370 1375 

Pro Val Pro Glu Gly Ala Gin Leu Ser Phe Gly Asn Phe Ala Gin Leu 
1380 1385 1390 

Gly His Glu Ser Phe Tyr Trp Gin Leu Pro Glu Thr Tyr Gin Gly Asp 
1395 1400 1405 

Lys Val Ala Ala Tyr Gly Gly Lys Lea Arg Tyr Thr Leu Ser Tyr Thr 
1410 1415 1420 

Ala Gly Pro Gin Gly Ser Pro Leu Ser Asp Pro Asp Val Gin He Thr 
1425 1430 1435 1440 

Gly Asn Asn He Met Leu Val Ala Ser Gin Pro Ala Leu Gin Gly Pro 
1445 1450 1455 
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Glu Arg Arg Ser Tyr Glu lie Met Phe Arg Glu Glu Phe Trp Arg Arg 
1460 1465 1470 



Pro Asp Gly Gin Pro Ala Thr Arg 
1475 1480 

Asp Leu 
1490 

Val Ala 
1505 

Ser Asn 



Glu His Leu Leu Met Ala Leu Ala 
1485 

Ser Val Pro Leu 



Gin Pro Gly Pro 
1520 

Arg Cys Pro Pro 
1535 



Asp Glu Leu Leu lie Arg Ala Thr Phe Ser 
1495 1500 

Ser lie Ser Ala Val Ser Leu Glu val Ala 
1510 1515 

Arg Pro Arg Ala Leu Glu Val Glu Glu Cys 
1525 1530 



Gly Tyr He Gly Leu Ser Cys Gin Asp Cys Ala Pro Gly Tyr Thr Arg 
1540 1545 1550 

Thr Gly Ser Gly Leu Tyr Leu Gly His Cys Glu Leu Cys Glu Cys Asn 
1555 1560 1565 

Gly His Ser Asp Leu Cys His Pro Glu Thr Gly Ala Cys Ser Gin Cys 
1570 1575 1580 

Gin His Asn Ala Ala Gly Glu Phe Cys Glu Leu Cys Ala Pro Gly Tyr 
1585 1590 1595 1600 

Tyr Gly Asp Ala Thr Ala Gly Thr Pro Glu Asp Cys Gin Pro Cys Ala 
1605 1610 1615 

Cys Pro Leu Thr Asn Pro Glu Asn Met Phe Ser Arg Thr Cys Glu Ser 
1620 1625 1630 

Leu Gly Ala Gly Gly Tyr Arg Cys Thr Ala Cys Glu Pro Gly Tyr Thr 
1635 1640 1645 

Gly Gin Tyr Cys Glu Gin Cys Gly Pro Gly Tyr Val Gly Asn Pro Ser 
1650 1655 1660 

Val Gin Gly Gly Gin Cys Leu Pro Glu Thr Asn Gin Ala Pro Leu Val 
1665 1670 1675 1680 

Val Glu Val His Pro Ala Arg Ser He Val Pro Gin Gly Gly Ser His 
1685 1690 1695 

Ser Leu Arg Cys Gin Val Ser Gly Arg Gly Pro His Tyr Phe Tyr Trp 
1700 1705 1710 

Ser Arg Glu Asp Gly Arg Pro Val Pro Ser Gly Thr Gin Gin Arg His 
1715 1720 1725 

Gin Gly Ser Glu Leu His Phe Pro Ser Val Gin Pro Ser Asp Ala Gly 
1730 1735 1740 

Val Tyr He Cys Thr Cys Arg Asn Leu His Arg Ser Asn Thr Ser Arg 
1745 1750 1755 1760 

Ala Glu Leu Leu Val Thr Glu Ala Pro Ser Lys Pro He Thr Val Thr 
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1765 1770 1775 

Val Glu Glu Gin Arg Ser Gin Ser Val Arg Pro Gly Ala Asp Val Thr 
1780 1785 1790 

Phe lie Cys Thr Ala Lys Ser Lys Ser Pro Ala Tyr Thr Leu Val Trp 
1795 18O0 1805 

Thr Arg Leu His Asn Gly Lys Leu Pro Thr Arg Ala Met Asp Phe Asn 
1810 1815 1820 

Gly lie Leu Thr lie Arg Asn Val Gin Leu Ser Asp Ala Gly Thr Tyr 
1825 1830 1835 1840 

Val Cys Thr Gly Ser Asn Met Phe Ala Met Asp Gin Gly Thr Ala Thr 
1845 1850 1855 

Leu His Val Gin Ala Ser Gly Thr Leu Ser Ala Pro Val Val Ser lie 
I860 1865 1870 

His Pro Pro Gin Leu Thr Val Gin Pro Gly Gin Leu Ala Glu Phe Arg 
1875 1880 1885 

Cys Ser Ala Thr Gly Ser Pro Thr Pro Thr Leu Glu Trp Thr Gly Gly 
1890 1895 1900 

Pro Gly Gly Gin Leu Pro Ala Lys Ala Gin He His Gly Gly He Leu 
1905 1910 1915 1920 

Arg Leu Pro Ala Val Glu Pro Thr Asp Gin Ala Gin Tyr Leu Cys Arg 
1925 1930 1935 

Ala His Ser Ser Ala Gly Gin Gin Val Ala Arg Ala Val Leu His Val 
1940 1945 1950 

His Gly Gly Gly Gly Pro Arg Val Gin Val Ser Pro Glu Arg Thr Gin 
1955 I960 1965 

Val His Ala Gly Arg Thr Val Arg Leu Tyr Cys Arg Ala Ala Gly Val 
1970 1975 1980 

Pro Ser Ala Thr He Thr Trp Arg Lys Glu Gly Gly Ser Leu Pro Pro 
1985 1990 1995 2000 

Gin Ala Arg Ser Glu Arg Thr Asp He Ala Thr Leu Leu He Pro Ala 
2005 2010 2015 

He Thr Thr Ala Asp Ala Gly Phe Tyr Leu Cys Val Ala Thr Ser Pro 
2020 2025 2030 

Ala Gly Thr Ala Gin Ala Arg He Gin Val Val Val Leu Ser Ala Ser 
2035 2040 2045 

Asp Ala Ser Gin Pro Pro Val Lys He Glu Ser Ser Ser Pro Ser Val 
2050 2055 2060 

Thr Glu Gly Gin Thr Leu Asp Leu Asn Cys Val Val Ala Gly Ser Ala 
2065 2070 2075 2080 
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His Ala Gin Val Thr Trp Tyr Arg Arg Gly Gly Ser Leu Pro His His 
2085 2090 2095 

Thr Gin Val His Gly Ser Arg Leu Arg Leu Pro Gin Val Ser Pro Ala 
2100 2105 2110 

Asp Ser Gly Glu Tyr Val Cys Arg Val Glu Asn Gly Ser Gly Pro Lys 
2115 2120 2125 

Glu Ala Ser He Thr Val Ser Val Leu His Gly Thr His Ser Gly Pro 
2130 2135 2140 

Ser Tyr Thr Pro Val Pro Gly Ser Thr Arg Pro He Arg He Glu Pro 
2145 2150 2155 2160 

Ser Ser Ser His Val Ala Glu Gly Gin Thr Leu Asp Leu Asn Cys Val 
2165 2170 2175 

Val Pro Gly Gin Ala His Ala Gin Val Thr Trp His Lys Arg Gly Gly 
2180 2185 2190 

Ser Leu Pro Ala Arg His Gin Thr His Gly Ser Leu Leu Arg Leu His 
2195 2200 2205 

Gin Val Thr Pro Ala Asp Ser Gly Glu Tyr Val Cys His Val Val Gly 
2210 2215 2220 

Thr Ser Gly Pro Leu Glu Ala Ser Val Leu Val Thr He Glu Ala Ser 
2225 2230 2235 2240 

Val He Pro Gly Pro He Pro Pro Val Arg He Glu Ser Ser Ser Ser 
2245 2250 2255 

Thr Val Ala Glu Gly Gin Thr Leu Asp Leu Ser Cys Val Val Ala Gly 
2260 2265 2270 

Gin Ala His Ala Gin Val Thr Trp Tyr Lys Arg Gly Gly Ser Leu Pro 
2275 2280 2285 

Ala Arg His Gin Val Arg Gly Ser Arg Leu Tyr He Phe Gin Ala Ser 
2290 2295 2300 

Pro Ala Asp Ala Gly Gin Tyr Val Cys Arg Ala Ser Asn Gly Met Glu 
2305 2310 2315 2320 

Ala Ser He Thr Val Thr Val Thr Gly Thr Gin Gly Ala Asn Leu Ala 
2325 2330 2335 

Tyr Pro Ala Gly Ser Thr Gin Pro He Arg He Glu Pro Ser Ser Ser 
2340 2345 2350 

Gin Val Ala Glu Gly Gin Thr Leu Asp Leu Asn Cys Val Val Pro Gly 
2355 2360 2365 

Gin Ser His Ala Gin Val Thr Trp His Lys Arg Gly Gly Ser Leu Pro 
2370 2375 2380 



Val Arg His Gin Thr His Gly Ser Leu Leu Arg Leu Tyr Gin Ala Ser 
2385 2390 2395 2400 
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Pro Ala Asp Ser Gly Glu Tyr Val Cys Arg Val Leu Gly Ser Ser Val 
2405 2410 2415 

Pro Leu Glu Ala Ser Val Leu Val Thr lie Glu Pro Ala Gly Ser Val 
2420 2425 2430 

Pro Ala Leu Gly Val Thr Pro Thr Val Arg lie Glu Ser Ser Ser Ser 
2435 2440 2445 

Gin Val Ala Glu Gly Gin Thr Leu Asp Leu Asn Cys Leu Val Ala Gly 
2450 2455 2460 

Gin Ala His Ala Gin Val Thr Trp His Lys Arg Gly Gly Ser Leu Pro 
2465 2470 2475 2480 

Ala Arg His Gin Val His Gly Ser Arg Leu Arg Leu Leu Gin Val Thr 
2485 2490 2495 

Pro Ala Asp Ser Gly Glu Tyr Val Cys Arg Val Val Gly Ser Ser Gly 
2500 2505 2510 

Thr Gin Glu Ala Ser Val Leu Val Thr He Gin Gin Arg Leu Ser Gly 
2515 2520 2525 

Ser His Ser Gin Gly Val Ala Tyr Pro Val Arg lie Glu Ser Ser Ser 
2530 2535 2540 

Ala Ser Leu Ala Asn Gly His Thr Leu Asp Leu Asn Cys Leu Val Ala 
2545 2550 2555 2560 

Ser Gin Ala Pro His Thr He Thr Trp Tyr Lys Arg Gly Gly Ser Leu 
2565 2570 2575 

Pro Ser Arg His Gin He Val Gly Ser Arg Leu Arg He Pro Gin Val 
2580 2585 2590 

Thr Pro Ala Asp Ser Gly Glu Tyr Val Cys His Val Ser Asn Gly Ala 
2595 2600 2605 

Gly Ser Arg Glu Thr Ser Leu He Val Thr He Gin Gly Ser Gly Ser 
2610 2615 2620 

Ser His Val Pro Arg Val Ser Pro Pro He Arg He Glu Ser Ser Ser 
2625 2630 2635 2640 

Pro Thr val Val Glu Gly Gin Thr Leu Asp Leu Asn Cys Val Val Ala 
2645 2650 2655 

Arg Gin Pro Gin Ala He He Thr Trp Tyr Lys Arg Gly Gly Ser Leu 
2660 2665 2670 

Pro Ser Arg His Gin Thr His Gly Ser His Leu Arg Leu His Gin Met 
2675 2680 2685 

Ser Val Ala Asp Ser Gly Glu Tyr Val Cys Arg Ala Asn Asn Asn He 
2690 2695 2700 



Asp Ala Leu Glu Ala Ser He Val He Ser Val Ser Pro Ser Ala Gly 
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2705 2710 2715 2720 

Ser Pro Ser Ala Pro Gly Ser Ser Met Pro lie Arg lie Glu Ser Ser 
2725 2730 2735 

Ser Ser His Val Ala Glu Gly Glu Thr Leu Asp Leu Asn Cys Val Val 
2740 2745 2750 

Pro Gly Gin Ala His Ala Gin Val Thr Trp His Lys Arg Gly Gly Ser 
2755 2760 2765 

Leu Pro Ser Tyr His Gin Thr Arg Gly Ser Arg Leu Arg Leu His His 
2770 2775 2780 

Val Ser Pro Ala Asp Ser Gly Glu Tyr Val Cys Arg Val Met Gly Ser 
2785 2790 2795 - 2800 

Ser Gly Pro Leu Glu Ala Ser Val Leu Val Thr lie Glu Ala Ser Gly 
2805 2810 2815 

Ser Ser Ala Val His Val Pro Ala Pro Gly Gly Ala Pro Pro lie Arg 
2820 2825 2830 

lie Glu Pro Ser Ser Ser Arg Val Ala Glu Gly Gin Thr Leu Asp Leu 
2835 2840 2845 

Lys Cys val Val Pro Gly Gin Ala His Ala Gin Val Thr Trp His Lys 
2850 2855 2860 

Arg Gly Gly Asn Leu Pro Ala Arg His Gin Val His Gly Pro Leu Leu 
2865 2870 2875 2880 

Arg Leu Asn Gin Val Ser Pro Ala Asp Ser Gly Glu Tyr Ser Cys Gin 
2885 2890 2895 

Val Thr Gly Ser Ser Gly Thr Leu Glu Ala Ser Val Leu Val Thr lie 
2900 2905 2910 

Glu Pro Ser Ser Pro Gly Pro lie Pro Ala Pro Gly Leu Ala Gin Pro 
2915 2920 2925 

He Tyr lie Glu Ala Ser Ser Ser His Val Thr Glu Gly Gin Thr Leu 
2930 2935 2940 

Asp Leu Asn Cys Val Val Pro Gly Gin Ala His Ala Gin Val Thr Trp 
2945 2950 2955 2960 

Tyr Lys Arg Gly Gly Ser Leu Pro Ala Arg His Gin Thr His Gly Ser 
2965 2970 2975 

Gin Leu Arg Leu His His Val Ser Pro Ala Asp Ser Gly Glu Tyr Val 
2980 2985 2990 

Cys Arg Ala Ala Gly Gly Pro Gly Pro Glu Gin Glu Ala Ser Phe Thr 
2995 3000 3005 

Val Thr Val Pro Pro Ser Glu Gly Ser Ser Tyr Arg Leu Arg Ser Pro 
3010 3015 3020 
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Val He Ser He Asp Pro Pro Ser Ser Thr Val Gin Gin Gly Gin Asp 
3025 3030 3035 3040 

Ala ser Phe Lys Cys Leu He His Asp Gly Ala Ala Pro He Ser Leu 
3045 3050 3055 

Glu Trp Lys Thr Arg Asn Gin Glu Leu Glu Asp Asn Val His He Ser 
3060 3065 3070 

Pro Asn Gly Ser lie He Thr He Val Gly Thr Arg Pro Ser Asn His 
3075 3080 3085 

Gly Thr Tyr Arg Cys Val Ala Ser Asn Ala Tyr Gly Val Ala Gin Ser 
3090 3095 3100 

Val val Asn Leu Ser Val His Gly Pro Pro Thr Val Ser Val Leu Pro 
3105 3110 3115 3120 

Glu Gly Pro Val Trp Val Lys Val Gly Lys Ala Val Thr Leu Glu Cys 
3125 3130 3135 

val Ser Ala Gly Glu Pro Arg Ser Ser Ala Arg Trp Thr Arg He Ser 
3140 3145 3150 

Ser Thr Pro Ala Lys Leu Glu Gin Arg Thr Tyr Gly Leu Met Asp Ser 
3155 3160 3165 

His Thr Val Leu Gin He Ser Ser Ala Lys Pro Ser Asp Ala Gly Thr 
3170 3175 3180 

Tyr val Cys Leu Ala Gin Asn Ala Leu Gly Thr Ala Gin Lys Gin Val 
3185 3190 3195 3200 

Glu val He Val Asp Thr Gly Ala Met Ala Pro Gly Ala Pro Gin Val 
3205 3210 3215 

Gin Ala Glu Glu Ala Glu Leu Thr Val Glu Ala Gly His Thr Ala Thr 
3220 3225 3230 

Leu Arg Cys Ser Ala Thr Gly Ser Pro Ala Arg Thr He His Trp Ser 
3235 3240 3245 

Lys Leu Arg Ser Pro Leu Pro Trp Gin His Arg Leu Glu Gly Asp Thr 
3250 3255 3260 

Leu He He Pro Arg Val Ala Gin Gin Asp Ser Gly Gin Tyr He Cys 
3265 3270 3275 3280 

Asn Ala Thr Ser Pro Ala Gly His Ala Glu Ala Thr He He Leu His 
3285 3290 3295 

Val Glu Ser Pro Pro Tyr Ala Thr Thr Val Pro Glu His Ala Ser Val 
33O0 3305 3310 

Gin Ala Gly Glu Thr Val Gin Leu Gin Cys Leu Ala His Gly Thr Pro 
3315 3320 3325 



Pro Leu Thr Phe Gin Trp Ser Arg Val Gly Ser Ser Leu Pro Gly Arg 
3330 3335 3340 
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Ala Thr Ala Arg Asn Glu Leu Leu His Phe Glu Arg Ala Ala Pro Glu 
3345 3350 3355 3360 

Asp Ser Gly Arg Tyr Arg Cys Arg Val Thr Asn Lys Val Gly Ser Ala 
3365 3370 3375 

Glu Ala Phe Ala Gin Leu Leu Val Gin Gly Pro Pro Gly Ser Leu Pro 
3380 3385 3390 

Ala Thr Ser lie Pro Ala Gly Ser Thr Pro Thr Val Gin Val Thr Pro 
3395 3400 3405 

Gin Leu Glu Thr Lys Ser lie Gly Ala Ser Val Glu Phe His Cys Ala 
3410 3415 3420 

Val Pro Ser Asp Arg Gly Thr Gin Leu Arg Trp Phe Lys Glu Gly Gly 
3425 3430 3435 3440 

Gin Leu Pro Pro Gly His Ser Val Gin Asp Gly Val Leu Arg He Gin 
3445 3450 3455 

Asn Leu Asp Gin Ser Cys Gin Gly Thr Tyr He Cys Gin Ala His Gly 
3460 3465 3470 

Pro Trp Gly Lys Ala Gin Ala Ser Ala Gin Leu Val He Gin Ala Leu 
3475 3480 3485 

Pro Ser Val Leu He Asn He Arg Thr Ser Val Gin Thr Val Val Val 
3490 3495 3500 

Gly His Ala Val Glu Phe Glu Cys Leu Ala Leu Gly Asp Pro Lys Pro 
3505 3510 3515 3520 

Gin Val Thr Trp Ser Lys Val Gly Gly His Leu Arg Pro Gly He Val 
3525 3530 3535 

Gin Ser Gly Gly Val Val Arg He Ala His Val Glu Leu Ala Asp Ala 
3540 3545 3550 

Gly Gin Tyr Arg Cys Thr Ala Thr Asn Ala Ala Gly Thr Thr Gin Ser 
3555 3560 3565 

His Val Leu Leu Leu Val Gin Ala Leu Pro Gin He Ser Met Pro Gin 
3570 3575 3580 

Glu val Arg Val Pro Ala Gly Ser Ala Ala Val Phe Pro Cys He Ala 
3585 3590 3595 3600 

Ser Gly Tyr Pro Thr Pro Asp He Ser Trp Ser Lys Leu Asp Gly Ser 
3605 3610 3615 

Leu Pro Pro Asp Ser Arg Leu Glu Asn Asn Met Leu Met Leu Pro Ser 
3620 3625 3630 

Val Gin Pro Gin Asp Ala Gly Thr Tyr Val Cys Thr Ala Thr Asn Arg 
3635 3640 3645 



Gin Gly Lys Val Lys Ala Phe Ala His Leu Gin Val Pro Glu Arg Val 
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3650 3655 3660 

Val Pro Tyr Phe Thr Gin Thr Pro Tyr Ser Phe Leu Pro Leu Pro Thr 
3665 3670 3675 3680 

lie Lys Asp Ala Tyr Arg Lys Phe Glu lie Lys lie Thr Phe Arg Pro 
3685 3690 3695 

Asp Ser Ala Asp Gly Met Leu Leu Tyr Asn Gly Gin Lys Arg Val Pro 
3700 3705 3710 

Gly Ser Pro Thr Asn Leu Ala Asn Arg Gin Pro Asp Phe lie Ser Phe 
3715 3720 3725 

Gly Leu Val Gly Gly Arg Pro Glu Phe Arg Phe Asp Ala Gly Ser Gly 
3730 3735 3740 

Met Ala Thr lie Arg His Pro Thr Pro Leu Ala Leu Gly His Phe His 
3745 3750 3755 3760 

Thr Val Thr Leu Leu Arg Ser Leu Thr Gin Gly Ser Leu lie Val Gly 

3765 3770 3775 

Asp Leu Ala Pro Val Asn Gly Thr Ser Gin Gly Lys Phe Gin Gly Leu 
3780 3785 3790 

Asp Leu Asn Glu Glu Leu Tyr Leu Gly Gly Tyr Pro Asp Tyr Gly Ala 
3795 3800 3805 

lie Pro Lys Ala Gly Leu Ser Ser Gly Phe lie Gly Cys Val Arg Glu 
3810 3815 3820 

Leu Arg lie Gin Gly Glu Glu lie Val Phe His Asp Leu Asn Leu Thr 
3825 3830 3835 3840 

Ala His Gly lie Ser His Cys Pro Thr Cys Arg Asp Arg Pro Cys Gin 
3845 3850 3855 

Asn Gly Gly Gin Cys His Asp Ser Glu Ser Ser Ser Tyr Val Cys Val 
3860 3865 3870 

Cys Pro Ala Gly Phe Thr Gly Ser Arg Cys Glu His Ser Gin Ala Leu 
3875 3880 3885 

His Cys His Pro Glu Ala Cys Gly Pro Asp Ala Thr Cys Val Asn Arg 
3890 3895 3900 

Pro Asp Gly Arg Gly Tyr Thr Cys Arg Cys His Leu Gly Arg Ser Gly 
3905 3910 3915 3920 

Leu Arg Cys Glu Glu Gly Val Thr Val Thr Thr Pro Ser Leu Ser Gly 
3925 3930 3935 

Ala Gly Ser Tyr Leu Ala Leu Pro Ala Leu Thr Asn Thr His His Glu 
3940 3945 3950 

Leu Arg Leu Asp Val Glu Phe Lys Pro Leu Ala Pro Asp Gly Val Leu 
3955 3960 3965 
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Leu Phe Ser Gly Gly Lys Ser Gly Pro Val Glu Asp Phe Val Ser Leu 
3970 3975 3980 

Ala Met Val Gly Gly His Leu Glu Phe Arg Tyr Glu Leu Gly Ser Gly 
3985 3990 3995 4000 

Leu Ala Val Leu Arg Thr Ala Glu Pro Leu Ala Leu Gly Arg Trp His 
4005 4010 4015 

Arg Val Ser Ala Glu Arg Leu Asn Lys Asp Gly Ser Leu Arg Val Asn 
4020 4025 4030 

Gly Gly Arg Pro Val Leu Arg Ser Ser Pro Gly Lys Ser Gin Gly Leu 
4035 4040 4045 

Asn Leu His Thr Leu Leu Tyr Leu Gly Gly Val Glu Pro Ser Val Pro 

4050 4055 4060 

Leu Ser Pro Ala Thr Asn Met Ser Ala His Phe Arg Gly Cys Val Gly 
4065 4070 4075 4080 

Glu Val Ser Val Asn Gly Lys Arg Leu Asp Leu Thr Tyr Ser Phe Leu 
4085 4090 4095 

Gly Ser Gin Gly lie Gly Gin Cys Tyr Asp Ser Ser Pro Cys Glu Arg 
4100 4105 4110 

Gin Pro Cys Gin His Gly Ala Thr Cys Met Pro Ala Gly Glu Tyr Glu 
4115 4120 4125 

Phe Gin Cys Leu Cys Arg Asp Gly lie Lys Gly Asp Leu Cys Glu His 
4130 4135 4140 

Glu Glu Asn Pro Cys Gin Leu Arg Glu Pro Cys Leu His Gly Gly Thr 
4145 4150 4155 4160 

Cys Gin Gly Thr Arg Cys Leu Cys Leu Pro Gly Phe Ser Gly Pro Arg 
4165 4170 4175 

Cys Gin Gin Gly Ser Gly His Gly lie Ala Glu Ser Asp Trp His Leu 
4180 4185 4190 

Glu Gly Ser Gly Gly Asn Asp Ala Pro Gly Gin Tyr Gly Ala Tyr Phe 
4195 4200 4205 

His Asp Asp Gly Phe Leu Ala Phe Pro Gly His Val Phe Ser Arg Ser 
4210 4215 4220 

Leu Pro Glu Val Pro Glu Thr lie Glu Leu Glu Val Arg Thr Ser Thr 
4225 4230 4235 4240 

Ala Ser Gly Leu Leu Leu Trp Gin Gly Val Glu Val Gly Glu Ala Gly 
4245 4250 4255 

Gin Gly Lys Asp Phe lie Ser Leu Gly Leu Gin Asp Gly His Leu Val 
4260 4265 4270 



Phe Arg Tyr Gin Leu Gly Ser Gly Glu Ala Arg Leu Val Ser Glu Asp 
4275 4280 4285 
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Pro lie Asn Asp Gly Glu Trp His Arg Val Thr Ala Leu Arg Glu Gly 
4290 4295 4300 

Arg Arg Gly Ser lie Gin Val Asp Gly Glu Glu Leu Val Ser Gly Arg 
4305 4310 4315 4320 

Ser Pro Gly Pro Asn Val Ala Val Asn Ala Lys Gly Ser lie Tyr lie 
4325 4330 4335 

Gly Gly Ala Pro Asp Val Ala Thr Leu Thr Gly Gly Arg Phe Ser Ser 
4340 4345 4350 

Gly He Thr Gly Cys Val Lys Asn Leu Val Leu His Ser Ala Arg Pro 
4355 4360 4365 

Gly Ala Pro Pro Pro Gin Pro Leu Asp Leu Gin His Arg Ala Gin Ala 
4370 4375 4380 

Gly Ala Asn Thr Arg Pro Cys Pro Ser 
4385 4390 



<210> 2 
<211> 195 
<212> PRT 

<213> Homo sapiens 
<400> 2 

Asp Ala Pro Gly Gin Tyr Gly Ala Tyr Phe His Asp Asp Gly Phe Leu 
15 10 15 

Ala Phe Pro Gly His Val Phe Ser Arg Ser Leu Pro Glu Val Pro Glu 
20 25 30 

Thr He Glu Leu Glu Val Arg Thr Ser Thr Ala Ser Gly Leu Leu Leu 
35 40 45 

Trp Gin Gly Val Glu Val Gly Glu Ala Gly Gin Gly Lys Asp Phe He 
50 55 60 

Ser Leu Gly Leu Gin Asp Gly His Leu Val Phe Arg Tyr Gin Leu Gly 
65 70 75 80 

Ser Gly Glu Ala Arg Leu Val Ser Glu Asp Pro He Asn Asp Gly Glu 
85 90 95 

Trp His Arg Val Thr Ala Leu Arg Glu Gly Arg Arg Gly Ser He Gin 
100 105 110 

Val Asp Gly Glu Glu Leu Val Ser Gly Arg Ser Pro Gly Pro Asn Val 

115 120 125 

Ala Val Asn Ala Lys Gly Ser Val Tyr He Gly Gly Ala Pro Asp Val 
130 135 140 



Ala Thr Leu Thr Gly Gly Arg Phe Ser Ser Gly He Thr Gly Cys Val 
145 150 155 160 
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Lys Asn Leu Val 



Pro Leu Asp Leu 
180 

Cys Pro Ser 
195 



Leu His Ser Ala 

165 

Gin His Arg Ala 



Arg Pro Gly Ala 

170 

Gin Ala Gly Ala 
185 



Pro Pro Pro Gin 
175 

Asn Thr Arg Pro 
190 



<210> 3 

<211> 508 

<212> PRT 

<213> Homo sapiens 

<400> 3 

Arg Thr Cys Arg Cys Lys Asn Asn Val Val Gly Arg Leu Cys Asn Glu 
15 10 15 

Cys Ala Asp Arg Ser Phe His Leu Ser Thr Arg Asn Pro Asp Gly Cys 

20 25 30 

Leu Lys Cys Phe Cys Met Gly Val Ser Arg His Cys Thr Ser Ser Ser 
35 40 45 

Trp Ser Arg Ala Gin Leu His Gly Ala Ser Glu Glu Pro Gly His Phe 
50 55 60 

Ser Leu Thr Asn Ala Ala Ser Thr His Thr Thr Asn Glu Gly lie Phe 
65 70 75 80 

Ser Pro Thr Pro Gly Glu Leu Gly Phe Ser Ser Phe His Arg Leu Leu 
85 90 95 

Ser Gly Pro Tyr Phe Trp Ser Leu Pro Ser Arg Phe Leu Gly Asp Lys 
100 105 110 

Val Thr Ser Tyr Gly Gly Glu Leu Arg Phe Thr Val Thr Gin Arg Ser 
115 120 125 

Gin Pro Gly Ser Thr Pro Leu His Gly Gin Pro Leu Val Val Leu Gin 
130 135 140 

Gly Asn Asn lie lie Leu Glu His His Val Ala Gin Glu Pro Ser Pro 
145 150 155 160 

Gly Gin Pro Ser Thr Phe lie Val Pro Phe Arg Glu Gin Ala Trp Gin 
165 170 175 

Arg Pro Asp Gly Gin Pro Ala Thr Arg Glu His Leu Leu Met Ala Leu 
180 185 190 

Ala Gly lie Asp Thr Leu Leu lie Arg Ala Ser Tyr Ala Gin Gin Pro 
195 200 205 



Ala Glu Ser Arg Leu Ser Gly lie Ser Met Asp Val Ala Val Pro Glu 
210 215 220 
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Glu Thr Gly Gin Asp Pro Ala Leu Glu Val Glu Gin Cys Ser Cys Pro 
225 230 235 240 

Pro Gly Tyr Leu Gly Pro Ser Cys Gin Asp Cys Asp Thr Gly Tyr Thr 
245 250 255 

Arg Thr Pro Ser Gly Leu Tyr Leii Gly Thr Cys Glu Arg Cys Ser Cys 
260 265 270 

His Gly His Ser Glu Ala Cys Glu Pro Glu Thr Gly Ala Cys Gin Gly 

275 280 285 

Cys Gin His His Thr Glu Gly Pro Arg Cys Glu Gin Cys Gin Pro Gly 
290 295 300 

Tyr Tyr Gly Asp Ala Gin Arg Gly Thr Pro Gin Asp Cys Gin Leu Cys 
305 310 315 320 

Pro Cys Tyr Gly Asp Pro Ala Ala Gly Gin Ala Ala Leu Thr Cys Phe 
325 330 335 

Leu Asp Thr Asp Gly His Pro Thr Cys Asp Ala Cys Ser Pro Gly His 
340 345 350 

Ser Gly Arg His Cys Glu Arg Cys Ala Pro Gly Tyr Tyr Gly Asn Pro 
355 360 365 

Ser Gin Gly Gin Pro Cys Gin Arg Asp Ser Gin Val Pro Gly Pro lie 
370 375 380 

Gly Cys Asn Cys Asp Pro Gin Gly Ser Val Ser Ser Gin Cys Asp Ala 
385 390 395 400 

Ala Gly Gin Cys Gin Cys Lys Ala Gin Val Glu Gly Leu Thr Cys Ser 
405 410 415 

His Cys Arg Pro His His Phe His Leu Ser Ala Ser Asn Pro Asp Gly 
420 425 430 

Cys Leu Pro Cys Phe Cys Met Gly lie Thr Gin Gin Cys Ala Ser Ser 
435 440 445 

Ala Tyr Thr Arg His Leu lie Ser Thr His Phe Ala Pro Gly Asp Phe 
450 455 460 

Gin Gly Phe Ala Leu Val Asn Pro Gin Arg Asn Ser Arg Leu Thr Gly 
465 470 475 480 

Glu Phe Thr Val Glu Pro Val Pro Glu Gly Ala Gin Leu Ser Phe Gly 
485 490 495 

Asn Phe Ala Gin Leu Gly His Glu Ser Phe Tyr Trp 
500 505 



<210> 4 
<211> 199 
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<212> PRT 

<213> Homo sapiens 
<400> 4 

Met Lys Trp Val Trp Ala Leu Leu Leu Leu Ala Ala Trp Ala Ala Ala 
1 5 10 15 

Glu Arg Asp Cys Arg Val Ser Ser Phe Arg Val Lys Glu Asn Phe Asp 
20 25 30 

Lys Ala Arg Phe Ser Gly Thr Trp Tyr Ala Met Ala Lys Lys Asp Pro 
35 40 45 

Glu Gly Leu Phe Leu Gin Asp Asn lie Val Ala Glu Phe Ser Val Asp 
50 55 60 

Glu Thr Gly Gin Met Ser Ala Thr Ala Lys Gly Arg Val Arg Leu Leu 
65 70 75 80 

Asn Asn Trp Asp Val Cys Ala Asp Met Val Gly Thr Phe Thr Asp Thr 

85 90 95 

Glu Asp Pro Ala Lys Phe Lys Met Lys Tyr Trp Gly Val Ala Ser Phe 
100 105 110 

Leu Gin Lys Gly Asn Asp Asp His Trp lie Val Asp Thr Asp Tyr Asp 
115 120 125 

Thr Tyr Ala Val Gin Tyr Ser Cys Arg Leu Leu Asn Leu Asp Gly Thr 
130 135 140 

Cys Ala Asp Ser Tyr Ser Phe Val Phe Ser Arg Asp Pro Asn Gly Leu 
145 150 155 160 

Pro Pro Glu Ala Gin Lys lie Val Arg Gin Arg Gin Glu Glu Leu Cys 
165 170 175 

Leu Ala Arg Gin Tyr Arg Leu lie Val His Asn Gly Tyr Cys Asp Gly 
180 185 190 

Arg Ser Glu Arg Asn Leu Leu 
195 



<210> 5 
<211> 199 
<212> PRT 

<213> Homo sapiens 
<400> 5 

Met Lys Trp Val Trp Ala Leu Leu Leu Leu Ala Ala Trp Ala Ala Ala 

15 10 15 

Glu Arg Asp Cys Arg Val Ser Ser Phe Arg Val Lys Glu Asn Phe Asp 
20 25 30 



Lys Ala Arg Phe Ser Gly Thr Trp Tyr Ala Met Ala Lys Lys Asp Pro 
35 40 45 
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Glu Gly Leu Phe Leu Gin Asp Asn lie Val Ala Glu Phe Ser Val Asp 
50 55 60 

Glu Thr Gly Gin Met Ser Ala Thr Ala Lys Gly Arg Val Arg Leu Leu 
65 70 75 80 

Asn Asn Trp Asp Val Cys Ala Asp Met Val Gly Thr Phe Thr Asp Thr 
85 90 95 

Glu Asp Pro Ala Lys Phe Lys Met Lys Tyr Trp Gly Val Ala Ser Phe 
100 105 110 

Leu Gin Lys Gly Asn Asp Asp His Trp lie Val Asp Thr Asp Tyr Asp 
115 120 125 

Thr Tyr Ala Val Gin Tyr Ser Cys Arg Leu Leu Asn Leu Asp Gly Thr 
130 135 140 

Cys Ala Asp Ser Tyr Ser Phe Val Phe Ser Arg Asp Pro Asn Gly Leu 
145 150 155 160 

Pro Pro Glu Ala Gin Lys lie Val Arg Gin Arg Gin Glu Glu Leu Cys 
165 170 175 

Leu Ala Arg Gin Tyr Arg Leu lie Val His Asn Gly Tyr Cys Asp Gly 
180 185 190 

Arg Ser Glu Arg Asn Leu Leu 
195 



<210> 6 

<211> 199 

<212> PRT 

<213> Homo sapiens 

<400> 6 

Met Lys Trp Val Trp Ala Leu Leu Leu Leu Ala Ala Trp Ala Ala Ala 
15 10 15 

Glu Arg Asp Cys Arg Val Ser Ser Phe Arg Val Lys Glu Asn Phe Asp 
20 25 30 

Lys Ala Arg Phe Ser Gly Thr Trp Tyr Ala Met Ala Lys Lys Asp Pro 
35 40 45 

Glu Gly Leu Phe Leu Gin Asp Asn lie Val Ala Glu Phe Ser Val Asp 
50 55 60 

Glu Thr Gly Gin Met Ser Ala Thr Ala Lys Gly Arg Val Arg Leu Leu 
65 70 75 80 

Asn Asn Trp Asp Val Cys Ala Asp Met Val Gly Thr Phe Thr Asp Thr 
85 90 95 



Glu Asp 



Pro Ala Lys Phe Lys Met Lys Tyr Trp Gly Val Ala Ser Phe 
100 105 110 



20 



Leu Gin Lys Gly 

115 

Thr Tyr Ala Val 
130 

Cys Ala Asp Ser 
145 

Pro Pro Glu Ala 



Leu Ala Arg Gin 
180 



Asn Asp Asp His 
120 

Gin Tyr Ser Cys 
135 

Tyr Ser Phe Val 
150 

Gin Lys lie Val 
165 

Tyr Arg Leu lie 



Trp He Val Asp 



Arg Leu Leu Asn 
140 

Phe Ser Arg Asp 
155 

Arg Gin Arg Gin 
170 

Val His Asn Gly 
185 



Thr Asp Tyr Asp 
125 

Leu Asp Gly Thr 



Pro Asn Gly Leu 
160 

Glu Glu Leu Cys 
175 

Tyr Cys Asp Gly 
190 



Arg Ser Glu Arg Asn Leu Leu 
195 



<210> 7 
<211> 182 
<212> PRT 

<213> Homo sapiens 



<400> 7 

Glu Arg Asp Cys 
1 

Lys Ala Arg Phe 
20 

Glu Gly Leu Phe 
35 

Glu Thr Gly Gin 
50 

Asn Asn Trp Asp 
65 

Glu Asp Pro Ala 



Arg Val Ser Ser 
5 

Ser Gly Thr Trp 



Leu Gin Asp Asn 
40 

Met Ser Ala Thr 
55 

Val Cys Ala Asp 
70 

Lys Phe Lys Met 
85 



Phe Arg Val Lys 
10 

Tyr Ala Met Ala 
25 

He Val Ala Glu 



Ala Lys Gly Arg 
60 

Met Val Gly Thr 
75 

Lys Tyr Trp Gly 
90 



Glu Asn Phe Asp 
15 

Lys Lys Asp Pro 
30 

Phe Ser Val Asp 
45 

Val Arg Leu Leu 



Phe Thr Asp Thr 
80 

Val Ala Ser Phe 
95 



Leu Gin Lys Gly Asn Asp Asp His 
100 

Thr Tyr Ala Val Gin Tyr Ser Cys 
115 120 

Cys Ala Asp Ser Tyr Ser Phe Val 
130 135 

Pro Pro Glu Ala Gin Lys lie Val 
145 150 

Leu Ala Arg Gin Tyr Arg Leu He 
165 



Trp He Val Asp Thr Asp Tyr Asp 
105 110 

Arg Leu Leu Asn Leu Asp Gly Thr 

125 

Phe Ser Arg Asp Pro Asn Gly Leu 
140 

Arg Gin Arg Gin Glu Glu Leu Cys 
155 160 

Val His Asn Gly Tyr Cys Asp Gly 
170 175 
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Arg Ser Glu Arg Asn Leu 
180 



<210> 8 

<211> 193 

<212> PRT 

<213> Homo sapiens 

<400> 8 

Met Gin Ser Leu Met Gin Ala Pro Leu Leu lie Ala Leu Gly Leu Leu 
15 10 IS 

Leu Ala Thr Pro Ala Gin Ala His Leu Lys Lys Pro Ser Gin Leu Ser 

20 25 30 

Ser Phe Ser Trp Asp Asn Cys Asp Glu Gly Lys Asp Pro Ala Val lie 
35 40 45 

Arg Ser Leu Thr Leu Glu Pro Asp Pre lie Val Val Pre Gly Acn Veil 
50 55 60 

Thr Leu Ser Val Val Gly Ser Thr Ser Val Pro Leu Ser Ser Pro Leu 
65 70 75 80 

Lys Val Asp Leu Val Leu Glu Lys Glu Val Ala Gly Leu Trp lie Lys 

85 90 95 

lie Pro Cys Thr Asp Tyr lie Gly Ser Cys Thr Phe Glu His Phe Cys 
100 105 110 

Asp Val Leu Asp Met Leu He Pro Thr Gly Glu Pro Cys Pro Glu Pro 
115 120 125 

Leu Arg Thr Tyr Gly Leu Pro Cys His Cys Pro Phe Lys Glu Gly Thr 
130 135 140 

Tyr Ser Leu Pro Lys Ser Glu Phe Val Val Pro Asp Leu Glu Leu Pro 
145 150 155 160 

Ser Trp Leu Thr Thr Gly Asn Tyr Arg He Glu Ser Val Leu Ser Ser 
165 170 175 

Ser Gly Lys Arg Leu Gly Cys He Lys He Ala Ala Ser Leu Lys Gly 
180 185 190 

He 



<210> 9 

<211> 193 

<212> PRT 

<213> Homo sapiens 



<400> 9 
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Met Gin Ser Leu Met Gin Ala Pro Leu Leu lie Ala Leu Gly Leu Leu 
15 10 15 

Leu Ala Thr Pro Ala Gin Ala His Leu Lys Lys Pro Ser Gin Leu Ser 
20 25 30 

Ser Phe Ser Trp Asp Asn Cys Phe Glu Gly Lys Asp Pro Ala Val He 
35 40 45 

Arg Ser Leu Thr Leu Glu Pro Asp Pro He Val Val Pro Gly Asn Val 
50 55 60 

Thr Leu Ser Val Val Gly Ser Thr Ser Val Pro Leu Ser Ser Pro Leu 
65 70 75 80 

Lys Val Asp Leu Val Leu Glu Lys Glu Val Ala Gly Leu Trp He Lys 
85 90 95 

He Pro Cys Thr Asp Tyr He Gly Ser Cys Thr Phe Glu His Phe Cys 
100 105 110 

Asp Val Leu Asp Met Leu He Pro Thr Gly Glu Pro Cys Pro Glu Pro 
115 120 125 

Leu Arg Thr Tyr Gly Leu Pro Cys His Cys Pro Phe Lys Glu Gly Thr 
130 135 140 

Tyr Ser Leu Pro Lys Ser Glu Phe Ala Val Pro Asp Leu Glu Leu Pro 
145 150 155 160 

Ser Trp Leu Thr Thr Gly Asn Tyr Arg He Glu Ser Val Leu Ser Ser 
165 170 175 

Ser Gly Lys Arg Leu Gly Cys He Lys He Ala Ala Ser Leu Lys Gly 
180 185 190 

He 



<210> 10 

<211> 178 

<212> PRT 

<213> Homo sapiens 

<400> 10 

Leu Leu Ala Thr Pro Ala Gin Ala His Leu Lys Lys Pro Ser Gin Leu 
15 10 15 

Ser Ser Phe Ser Trp Asp Asn Cys Asp Glu Gly Lys Asp Pro Ala Val 
20 25 30 

He Arg Ser Leu Thr Leu Glu Pro Asp Pro He Val Val Pro Gly Asn 
35 40 45 

Val Thr Leu Ser Val Val Gly Ser Thr Ser Val Pro Leu Ser Ser Pro 
50 55 60 



23 



Leu Lys val Asp 
65 

Lys lie Pro Cys 



Cys Asp Val Leu 
100 

Pro Leu Arg Thr 
115 

Thr Tyr Ser Leu 

130 

Pro Ser Trp Leu 
145 

Ser Ser Gly Lys 



Gly lie 



Leu Val Leu Glu 
70 

Thr Asp Tyr lie 
85 

Asp Met Leu lie 



Tyr Gly Leu Pro 
120 

Pro Lys Ser Glu 
135 

Thr Thr Gly Asn 
150 

Arg Leu Gly Cys 
165 



Lys Glu Val Ala 
75 

Gly Ser Cys Thr 
90 

Pro Thr Gly Glu 
105 

Cys His Cys Pro 



Phe Val Val Pro 

140 

Tyr Arg lie Glu 
155 

He Lys He Ala 
170 



Gly Leu Trp He 
80 

Phe Glu His Phe 
95 

Pro Cys Pro Glu 
110 

Phe Lys Glu Gly 
125 

Asp Leu Glu Leu 



Ser Val Leu Ser 
160 

Ala Ser Leu Lys 
175 



<210> 11 
<211> 200 
<212> PRT 

<213> Homo sapiens 

<400> 11 

Arg Ala Gly Pro Pro Phe Pro Met Gin Ser Leu Met Gin Ala Pro Leu 
15 10 15 

Leu He Ala Leu Gly Leu Leu Leu Ala Ala Pro Ala Gin Ala His Leu 
20 25 30 

Lys Lys Pro Ser Gin Leu Ser Ser Phe Ser Trp Asp Asn Cys Asp Glu 
35 40 45 

Gly Lys Asp Pro Ala Val He Arg Ser Leu Thr Leu Glu Pro Asp Pro 
50 55 60 

He He Val Pro Gly Asn Val Thr Leu Ser Val Met Gly Ser Thr Ser 
65 70 75 80 

Val Pro Leu Ser Ser Pro Leu Lys Val Asp Leu Val Leu Glu Lys Glu 
85 90 95 

Val Ala Gly Leu Trp He Lys He Pro Cys Thr Asp Tyr He Gly Ser 
100 105 110 

Cys Thr Phe Glu His Phe Cys Asp Val Leu Asp Met Leu He Pro Thr 
115 120 125 



Gly Glu Pro Cys Pro Glu Pro Leu Arg Thr Tyr Gly Leu Pro Cys His 
130 135 140 
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Cys Pro Phe Lys Glu 
145 

Val Pro Asp Leu Glu 
165 

lie Glu Ser Val Leu 

180 

lie Ala Ala Ser Leu 
195 



Gly Thr Tyr Ser Leu Pro 
150 155 

Leu Pro Ser Trp Leu Thr 
170 

Ser Ser Ser Gly Lys Arg 
185 

Lys Gly lie 
200 



Lys Ser Glu Phe Val 
160 

Thr Gly Asn Tyr Arg 
175 

Leu Gly Cys lie Lys 
190 



<210> 12 

<211> 189 

<212> PRT 

<213> Homo sapiens 

<400> 12 

Met Gin Ala Pro Leu Leu lie Ala Leu Gly Leu Leu Leu Ala Thr Pro 
15 10 15 

Ala Gin Ala His Leu Lys Lys Pro Ser Gin Leu Ser Ser Phe Ser Trp 
20 25 30 

Asp Asn Cys Asp Glu Gly Lys Asp Pro Ala Val lie Arg Ser Leu Thr 
35 40 45 

Leu Glu Pro Asp Pro He Val Val Pro Gly Asn Val Thr Leu Ser Val 
50 55 60 

Val Gly Ser Thr Ser Val Pro Leu Ser Ser Pro Leu Lys Val Asp Leu 
65 70 75 80 

Val Leu Glu Lys Glu Val Ala Gly Leu Trp lie Lys He Pro Cys Thr 
85 90 95 

Asp Tyr He Gly Ser Cys Thr Phe Glu His Phe Cys Asp Val Leu Asp 
100 105 110 

Met Leu He Pro Thr Gly Glu Pro Cys Pro Glu Pro Leu Arg Thr Tyr 
115 120 125 

Gly Leu Pro Cys His Cys Pro Phe Lys Glu Gly Thr Tyr Ser Leu Pro 
130 135 140 

Lys Ser Glu Phe Val Val Pro Asp Leu Glu Leu Pro Ser Trp Leu Thr 
145 150 155 160 

Thr Gly Asn Tyr Arg He Glu Ser Val Leu Ser Ser Ser Gly Lys Arg 
165 170 175 

Leu Gly Cys He Lys He Ala Ala Ser Leu Lys Gly He 
180 185 



<210> 13 
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<211> 193 
<212> PRT 

<213> Homo sapiens 
<400> 13 

Met Gin Ser Leu Met Gin Ala Pro Leu Leu lie Ala Leu Gly Leu Leu 
15 10 15 

Leu Ala Thr Pro Ala Gin Ala His Leu Lys Lys Pro Ser Gin Leu Ser 
20 25 30 

Ser Phe Ser Trp Asp Asn Cys Asp Glu Gly Lys Asp Pro Ala Val lie 
35 40 45 

Arg Ser Leu Thr Leu Glu Pro Asp Pro lie Val Val Pro Gly Asn Val 
50 55 60 

Thr Leu Ser Val Val Gly Ser Thr Ser Val Pro Leu Ser Ser Pro Leu 
65 70 75 80 

Lys Val Asp Leu Val Leu Glu Lys Glu Val Ala Gly Leu Trp lie Lys 
85 90 95 

He Pro Cys Thr Asp Tyr lie Gly Ser Cys Thr Phe Glu His Phe Cys 
100 105 110 

Asp Val Leu Asp Met Leu He Pro Thr Gly Glu Pro Cys Pro Glu Pro 

115 120 125 

Leu Arg Thr Tyr Gly Leu Pro Cys His Cys Pro Phe Lys Glu Gly Thr 
130 135 140 

Tyr Ser Leu Pro Lys Ser Glu Phe Val Val Pro Asp Leu Glu Leu Pro 
145 150 155 160 

Ser Trp Leu Thr Thr Gly Asn Tyr Arg He Glu Ser Val Leu Ser Ser 
165 170 175 

Ser Gly Lys Arg Leu Gly Cys He Lys He Ala Ala Ser Leu Lys Gly 
180 185 190 

He 



<210> 14 
<211> 193 

<212> PRT 

<213> Homo sapiens 
<400> 14 

Met Gin Ser Leu Met Gin Ala Pro Leu Leu He Ala Leu Gly Leu Leu 
15 10 15 

Leu Ala Thr Pro Ala Gin Ala His Leu Lys Lys Pro Ser Gin Leu Ser 
20 25 30 

Ser Phe Ser Trp Asp Asn Cys Asp Glu Gly Lys Asp Pro Ala Val He 
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35 

Arg Ser Leu Thr 
50 

Thr Leu Ser Val 
65 

Lys Val Asp Leu 



lie Pro Cys Thr 
100 

Asp Val Leu Asp 
115 

Leu Arg Thr Tyr 
130 

Tyr Ser Leu Pro 
145 

Ser Trp Leu Thr 



Ser Gly Lys Arg 
180 

lie 



40 

Leu Glu Pro Asp 
55 

Val Gly Ser Thr 
70 

Val Leu Glu Lys 

85 

Asp Tyr lie Gly 



Met Leu lie Pro 
120 

Gly Leu Pro Cys 
135 

Lys Ser Glu Phe 
150 

Thr Gly Asn Tyr 
165 

Leu Gly Cys lie 



Pro lie Val Val 
60 

Ser Val Pro Leu 
75 

Glu Val Ala Gly 
90 

Ser Cys Thr Phe 
105 

Thr Gly Glu Pro 



His Cys Pro Phe 
140 

Val Val Pro Asp 
155 

Arg lie Glu Ser 

170 

Lys lie Ala Ala 
185 



45 

Pro Gly Asn Val 



Ser Ser Pro Leu 
80 

Leu Trp lie Lys 
95 

Glu His Phe Cys 
110 

Cys Pro Glu Pro 
125 

Lys Glu Gly Thr 



Leu Glu Leu Pro 
160 

Val Leu Ser Ser 

175 

Ser Leu Lys Gly 
190 



<210> 15 
<211> 193 
<212> PRT 

<213> Homo sapiens 
<400> 15 

Met Gin Ser Leu Met Gin Ala Pro Leu Leu lie Ala Leu Gly Leu Leu 
15 10 15 

Leu Ala Thr Pro Ala Gin Ala His Leu Lys Lys Pro Ser Gin Leu Ser 
20 25 30 

Ser Phe Ser Trp Asp Asn Cys Asp Glu Gly Lys Asp Pro Ala Val lie 
35 40 45 

Arg Ser Leu Thr Leu Glu Pro Asp Pro lie Val Val Pro Gly Asn Val 
50 55 60 

Thr Leu Ser Val Val Gly Ser Thr Ser Val Pro Leu Ser Ser Pro Leu 
65 70 75 80 

Lys Val Asp Leu Val Leu Glu Lys Glu Val Ala Gly Leu Trp lie Lys 
85 90 95 

lie Pro Cys Thr Asp Tyr lie Gly Ser Cys Thr Phe Glu His Phe Cys 
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100 

Asp Val Leu Asp 
115 

Leu Arg Thr Tyr 

130 

Tyr Ser Leu Pro 
145 

Ser Trp Leu Thr 



Ser Gly Lys Arg 
180 

lie 



Met Leu lie Pro 
120 

Gly Leu Pro Cys 
135 

Lys Ser Glu Phe 
150 

Thr Gly Asn Tyr 
165 

Leu Gly Cys He 



105 

Thr Gly Glu Pro 



His Cys Pro Phe 

140 

Val val Pro Asp 
155 

Arg He Glu Ser 
170 

Lys He Ala Ala 
185 



110 

Cys Pro Glu Pro 
125 

Lys Glu Gly Thr 



Leu Glu Leu Pro 
160 

Val Leu Ser Ser 
175 

Ser Leu Lys Gly 
190 



<210> 16 

<211> 193 

<212> PRT 

<213> Homo sapiens 

<400> 16 

Met Gin Ser Leu Met Gin Ala Pro Leu Leu He Ala Leu Gly Leu Leu 
15 10 15 

Leu Ala Thr Pro Ala Gin Ala His Leu Lys Lys Pro Ser Gin Leu Ser 
20 25 30 

Ser Phe Ser Trp Asp Asn Cys Asp Glu Gly Lys Asp Pro Ala Val He 
35 40 45 

Arg Ser Leu Thr Leu Glu Pro Asp Pro He Val Val Pro Gly Asn Val 
50 55 60 

Thr Leu Ser Val Val Gly Ser Thr Ser Val Pro Leu Ser Ser Pro Leu 
65 70 75 80 

Lys Val Asp Leu Val Leu Glu Lys Glu Val Ala Gly Leu Trp He Lys 
85 90 95 

He Pro Cys Thr Asp Tyr He Gly Ser Cys Thr Phe Glu His Phe Cys 
100 105 110 

Asp Val Leu Asp Met Leu He Pro Thr Gly Glu Pro Cys Pro Glu Pro 
115 120 125 

Leu Arg Thr Tyr Gly Leu Pro Cys His Cys Pro Phe Lys Glu Gly Thr 
130 135 140 

Tyr Ser Leu Pro Lys Ser Glu Phe Val Val Pro Asp Leu Glu Leu Pro 
145 150 155 160 



Ser Trp Leu Thr Thr Gly Asn Tyr Arg lie Glu Ser Val Leu Ser Ser 
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165 170 175 

Ser Gly Lys Arg Leu Gly Cys lie Lys He Ala Ala Ser Leu Lys Gly 
180 185 190 

He 



<210> 17 
<211> 114 
<212> PRT 

<213> Homo sapiens 
<400> 17 

Met Thr Cys Lys Met Ser Gin Leu Glu Arg Asn He Glu Thr He He 
15 10 15 

Asn Thr Phe His Gin Tyr Ser Val Lys Leu Gly His Pro Asp Thr Leu 
20 25 30 

Asn Gin Gly Glu Phe Lys Glu Leu Val Arg Lys Asp Leu Gin Asn Phe 
35 40 45 

Leu Lys Lys Glu Asn Lys Asn Glu Lys Val He Glu His He Met Glu 
50 55 60 

Asp Leu Asp Thr Asn Ala Asp Lys Gin Leu Ser Phe Glu Glu Phe He 
65 70 75 80 

Met Leu Met Ala Arg Leu Thr Trp Ala Ser His Glu Lys Met His Glu 
85 90 95 

Gly Asp Glu Gly Pro Gly His His His Lys Pro Gly Leu Gly Glu Gly 
100 105 110 

Thr Pro 



<210> 18 
<211> 93 
<212> PRT 

<213> Homo sapiens 
<400> 18 

Met Leu Thr Glu Leu Glu Lys Ala Leu Asn Ser He He Asp Val Tyr 
15 10 15 

His Lys Tyr Ser Leu He Lys Gly Asn Phe His Ala Val Tyr Arg Asp 
20 25 30 

Asp Leu Lys Lys Leu Leu Glu Thr Glu Cys Pro Gin Tyr He Arg Lys 
35 40 45 



Lys Gly Ala Asp Val Trp Phe Lys Glu Leu Asp He Asn Thr Asp Gly 
50 55 60 
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Ala Val Asn Phe Gin Glu Phe Leu lie Leu Val He Lys Met Gly Val 

65 70 75 80 

Ala Ala His Lys Lys Ser His Glu Glu Ser His Lys Glu 
85 90 



<210> 19 
<211> 92 
<212> PRT 

<213> Homo sapiens 
<400> 19 

Met Thr Lys Leu Glu Glu His Leu Glu Gly He Val Asn He Phe His 
15 10 15 

Gin Tyr Ser Val Arg Lys Gly His Phe Asp Thr Leu Ser Lys Gly Glu 
20 25 30 

Leu Lys Gin Leu Leu Thr Lys Glu Leu Ala Asn Thr He Lys Asn He 
35 40 45 

Lys Asp Lys Ala Val He Asp Glu He Phe Gin Gly Leu Asp Ala Asn 
50 55 60 

Gin Asp Glu Gin Val Asp Phe Gin Glu Phe He Ser Leu Val Ala He 
65 70 75 80 

Ala Leu Lys Ala Ala His Tyr His Thr His Lys Glu 
85 90 



<210> 20 

<211> 92 

<212> PRT 

<213> Homo sapiens 

<400> 20 

Met Thr Lys Leu Glu Glu His Leu Glu Gly He Val Asn He Phe His 
15 10 15 

Gin Tyr Ser Val Arg Lys Gly His Phe Asp Thr Leu Ser Lys Gly Glu 
20 25 30 

Leu Lys Gin Leu Leu Thr Lys Glu Leu Ala Asn Thr He Lys Asn He 
35 40 45 

Lys Asp Lys Ala Val He Asp Glu He Phe Gin Gly Leu Asp Ala Asn 
50 55 60 

Gin Asp Glu Gin Val Asp Phe Gin Glu Phe He Ser Leu Val Ala He 
65 70 75 80 

Ala Leu Lys Ala Ala His Tyr His Thr His Lys Glu 
85 90 
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<210> 21 

<211> 91 

<212> PRT 

<213> Homo sapiens 

<400> 21 

Thr Lys Leu Glu Glu His Leu Glu Gly lie Val Asn He Phe His Gin 
15 10 15 

Tyr Ser Val Arg Lys Gly His Phe Asp Thr Leu Ser Lys Gly Glu Leu 
20 25 30 

Lys Gin Leu Leu Thr Lys Glu Leu Ala Asn Thr He Lys Asn He Lys 
35 40 45 

Asp Lys Ala Val He Asp Glu He Phe Gin Gly Leu Asp Ala Asn Gin 
50 55 60 

Asp Glu Gin Val Asp Phe Gin Glu Phe He Ser Leu Val Ala He Ala 
65 70 75 80 

Leu Lys Ala Ala His Tyr His Thr His Lys Glu 
85 90 



<210> 22 

<211> 93 

<212> PRT 

<213> Homo sapiens 

<400> 22 

Met Leu Thr Glu Leu Glu Lys Ala Leu Asn Ser He He Asp Val Tyr 
15 10 15 

His Lys Tyr Ser Leu He Lys Gly Asn Phe His Ala Val Tyr Arg Asp 
20 25 30 

Asp Leu Lys Lys Leu Leu Glu Thr Glu Cys Pro Gin Tyr He Arg Lys 
35 40 45 

Lys Gly Ala Asp Val Trp Phe Lys Glu Leu Asp He Asn Thr Asp Gly 
50 55 60 

Ala Val Asn Phe Gin Glu Phe Leu He Leu Val He Lys Met Gly Val 
65 70 75 80 

Ala Ala His Lys Lys Ser His Glu Glu Ser His Lys Glu 
85 90 



<210> 23 

<211> 92 

<212> PRT 

<213> Homo sapiens 
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<400> 23 

Met Thr Lys Leu Glu Glu His Leu 
1 5 

Gin Tyr Ser Val Arg Lys Gly His 
20 

Leu Lys Gin Leu Leu Thr Lys Glu 
35 40 

Lys Asp Lys Ala Val He Asp Glu 
50 55 

Gin Asp Glu Gin Val Asp Phe Gin 
65 70 

Ala Leu Lys Ala Ala His Tyr His 
85 



Glu Gly He Val Asn He Phe His 
10 15 

Phe Asp Thr Leu Ser Lys Gly Glu 
25 30 

Leu Ala Asn Thr He Lys Asn He 
45 

He Phe Gin Gly Leu Asp Ala Asn 
60 

Glu Phe He Ser Leu Val Ala He 
75 80 

Thr His Lys Glu 
90 



<210> 24 
<211> 85 
<212> PRT 

<213> Homo sapiens 
<400> 24 

Asp Asn Gly Asp Val Cys Gin Asp Cys He Gin Met Val Thr Asp He 
15 10 15 

Gin Thr Ala Val Arg Thr Asn Ser Thr Phe Val Gin Ala Leu Val Glu 
20 25 30 

His Val Lys Glu Glu Cys Asp Arg Leu Gly Pro Gly Met Ala Asp He 
35 40 45 

Cys Lys Asn Tyr He Ser Gin Tyr Ser Glu He Ala He Gin Met Met 
50 55 60 

Met His Met Gin Asp Gin Gin Pro Lys Glu He Cys Ala Leu Val Gly 
65 70 75 80 

Phe Cys Asp Glu Val 
85 



<210> 25 
<211> 381 
<212> PRT 

<213> Homo sapiens 
<400> 25 

Met Ala Glu Ser His Leu Leu Gin Trp Leu Leu Leu Leu Leu Pro Thr 
15 10 15 

Leu Cys Gly Pro Gly Thr Ala Ala Trp Thr Thr Ser Ser Leu Ala Cys 
20 25 30 
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Ala Gin Gly Pro 
35 

Cys Arg Ala Leu 
50 

Ala Asp Asp Leu 
65 

Lys Met Ala Lys 



Glu Gin Glu Cys 
100 

Asn Gin Val Leu 
115 

Asn Gin lie Asp 
130 

Ser Arg Gin Pro 
145 

Pro Lys Pro Leu 



Val Leu Pro Val 
180 

Thr Gin Asp Leu 
195 

Trp Leu Cys Arg 
210 

Gly Ala Leu Arg 

225 

Val Ala Gly Gly 



Leu Leu Asp Thr 
260 

Leu Val Leu Arg 
275 

Thr Gly Glu Trp 

290 

Val Thr Thr Gin 
305 

Met Leu Gin Ala 



Gin Phe Val Glu 
340 



Glu Phe Trp Cys 
40 

Gly His Cys Leu 
55 

Cys Gin Glu Cys 
70 

Glu Ala lie Phe 
85 

Asn Val Leu Pro 



Asp Asp Tyr Phe 
120 

Ser Asn Gly lie 
135 

Glu Pro Glu Gin 
150 

Arg Asp Pro Leu 
165 

Leu Pro Gly Ala 



Ser Glu Gin Gin 
200 

Ala Leu lie Lys 
215 

Val Ala Val Ala 

230 

lie Cys Gin Cys 
245 

Leu Leu Gly Arg 



Cys Ser Met Asp 
280 

Leu Pro Arg Asp 

295 

Ala Gly Asn Ser 
310 

Cys Val Gly Ser 
325 

Gin His Thr Pro 



Gin Ser Leu Glu 



Gin Glu Val Trp 
60 

Glu Asp lie Val 
75 

Gin Asp Thr Met 
90 

Leu Lys Leu Leu 
105 

Pro Leu Val He 



Cys Met His Leu 
140 

Glu Pro Gly Met 
155 

Pro Asp Pro Leu 
170 

Leu Gin Ala Arg 
185 

Phe Pro He Pro 



Arg He Gin Ala 
220 

Gin Val Cys Arg 

235 

Leu Ala Glu Arg 
250 

Met Leu Pro Gin 
265 

Asp Ser Ala Gly 



Ser Glu Cys His 

300 

Ser Glu Gin Ala 
315 

Trp Leu Asp Arg 
330 

Gin Leu Leu Thr 
345 



Gin Ala Leu Gin 
45 

Gly His Val Gly 



His He Leu Asn 
80 

Arg Lys Phe Leu 
95 

Met Pro Gin Cys 
110 

Asp Tyr Phe Gin 
125 

Gly Leu Cys Lys 



Ser Asp Pro Leu 
160 

Leu Asp Lys Leu 
175 

Pro Gly Pro His 
190 

Leu Pro Tyr Cys 
205 

Met He Pro Lys 



Val Val Pro Leu 

240 

Tyr Ser Val He 
255 

Leu Val Cys Arg 
270 

Pro Arg Ser Pro 
285 

Leu Cys Met Ser 



He Pro Gin Ala 
320 

Glu Lys Cys Lys 
335 

Leu Val Pro Arg 
350 
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Gly Trp Asp Ala His Thr Thr Cys Gin Ala Leu Gly Val Cys Gly Thr 
355 360 365 

Met Ser Ser Pro Leu Gin Cys lie His Ser Pro Asp Leu 
370 375 380 



<210> 26 
<211> 379 
<212> PRT 

<213> Homo sapiens 

<400> 26 

Met Ala Glu Ser His Leu Leu Gin Trp Leu Leu Leu Leu Leu Pro Thr 
15 10 15 

Leu Cys Gly Pro Gly Thr Ala Ala Trp Thr Thr Ser Ser Leu Ala Cys 
20 25 30 

Ala Gin Gly Pro Glu Phe Trp Cys Gin Ser Leu Glu Gin Ala Leu Gin 
35 40 45 

Cys Arg Ala Leu Gly His Cys Leu Gin Glu Val Trp Gly His Val Gly 

50 55 60 

Ala Asp Asp Leu Cys Gin Glu Cys Glu Asp lie Val His lie Leu Asn 
65 70 75 80 

Lys Met Ala Lys Glu Ala lie Phe Gin Asp Thr Met Arg Lys Phe Leu 
85 90 95 

Glu Gin Glu Cys Asn Val Leu Pro Leu Lys Leu Leu Met Pro Gin Cys 
100 105 110 

Asn Gin Val Leu Asp Asp Tyr Phe Pro Leu Val lie Asp Tyr Phe Gin 
115 120 125 

Asn Gin Thr Asp Ser Asn Gly lie Cys Met His Leu Gly Cys Lys Ser 

130 135 140 

Arg Gin Pro Glu Pro Glu Gin Glu Pro Gly Met Ser Asp Pro Leu Pro 
145 150 155 160 

Lys Pro Leu Arg Asp Pro Leu Pro Asp Pro Leu Leu Asp Lys Leu Val 
165 170 175 

Leu Pro Val Leu Pro Gly Ala Leu Gin Ala Arg Pro Gly Pro His Thr 
180 185 190 

Gin Asp Leu Ser Glu Gin Gin Phe Pro He Pro Leu Pro Tyr Cys Trp 
195 200 205 

Cys Arg Ala Leu lie Lys Arg He Gin Ala Met He Pro Lys Gly Ala 
210 215 220 



Leu Arg Val Ala Val Ala Gin Val Cys Arg Val Val Pro Leu Val Ala 
225 230 235 240 



34 



Gly Gly lie Cys 



Asp Thr Leu Leu 
260 

Leu Arg Cys Ser 
275 

Glu Trp Leu Pro 
290 

Thr Gin Ala Gly 
305 

Gin Ala Cys Val 



Val Glu Gin His 
340 

Asp Ala His Thr 
355 

Ser Pro Leu Gin 
370 



Gin Cys Leu Ala 
245 

Gly Arg Met Leu 



Met Asp Asp Ser 
280 

Arg Asp Ser Glu 
295 

Asn Ser Ser Glu 
310 

Gly Ser Trp Leu 
325 

Thr Pro Gin Leu 



Thr Cys Gin Ala 
360 

Cys lie His Ser 
375 



Glu Arg Tyr Ser 
250 

Pro Gin Leu Val 
265 

Ala Gly Pro Arg 



Cys His Leu Cys 
300 

Gin Ala He Pro 
315 

Asp Arg Glu Lys 

330 

Leu Thr Leu Val 
345 

Leu Gly Val Cys 



Pro Asp Leu 



Val He Leu Leu 
255 

Cys Arg Leu Val 
270 

Ser Pro Thr Gly 
285 

Met Ser Val Thr 



Gin Ala Met Leu 
320 

Cys Lys Gin Phe 

335 

Pro Arg Gly Trp 
350 

Gly Thr Met Ser 
365 



<210> 27 

<211> 527 

<212> PRT 

<213> Homo sapiens 

<400> 27 

Met Tyr Ala Leu Phe Leu Leu Ala Ser Leu Leu Gly Ala Ala Leu Ala 
15 10 15 

Gly Pro Val Leu Gly Leu Lys Glu Cys Thr Arg Gly Ser Ala Val Trp 
20 25 30 

Cys Gin Asn Val Lys Thr Ala Ser Asp Cys Gly Ala Val Lys His Cys 
35 40 45 

Leu Gin Thr Val Trp Asn Lys Pro Thr Val Lys Ser Leu Pro Cys Asp 
50 55 60 

He Cys Lys Asp Val Val Thr Ala Ala Gly Asp Met Leu Lys Asp Asn 
65 70 75 80 

Ala Thr Glu Glu Glu He Leu Val Tyr Leu Glu Lys Thr Cys Asp Trp 
85 90 95 

Leu Pro Lys Pro Asn Met Ser Ala Ser Cys Lys Glu He Val Asp Ser 
100 105 110 



Tyr Leu Pro Val He Leu Asp He He Lys Gly Glu Met Ser Arg Pro 
115 120 125 



35 



Gly Glu Val Cys Ser Ala Leu Asn Leu Cys Glu Ser Leu Gin Lys His 
130 135 140 

Leu Ala Glu Leu Asn His Gin Lys Gin Leu Glu Ser Asn Lys lie Pro 
145 150 155 160 

Glu Leu Asp Met Thr Glu Val Val Ala Pro Phe Met Ala Asn lie Pro 
165 170 175 

Leu Leu Leu Tyr Pro Gin Asp Gly Pro Arg Ser Lys Pro Gin Pro Lys 
180 185 190 

Asp Asn Gly Asp Val Cys Gin Asp Cys lie Gin Met Val Thr Asp lie 
195 200 205 

Gin Thr Ala Val Arg Thr Asn Ser Thr Phe Val Gin Ala Leu Val Glu 
210 215 220 

His Val Lys Glu Glu Cys Asp Arg Leu Gly Pro Gly Met Ala Asp lie 
225 230 235 240 

Cys Lys Asn Tyr lie Ser Gin Tyr Ser Glu lie Ala He Gin Met Met 
245 250 255 

Met His Met Gin Asp Gin Gin Pro Lys Glu He Cys Ala Leu Val Gly 
260 265 270 

Phe Cys Asp Glu Val Lys Glu Met Pro Met Gin Thr Leu Val Pro Ala 
275 280 285 

Lys Val Ala Ser Lys Asn Val He Pro Ala Leu Glu Leu Val Glu Pro 
290 295 300 

He Lys Lys His Glu Val Pro Ala Lys Ser Asp Val Tyr Cys Glu Val 

305 310 315 320 

Cys Glu Phe Leu Val Lys Glu Val Thr Lys Leu He Asp Asn Asn Lys 
325 330 335 

Thr Glu Lys Glu He Leu Asp Ala Phe Asp Lys Met Cys Ser Lys Leu 
340 345 350 

Pro Lys Ser Leu Ser Glu Glu Cys Gin Glu Val Val Asp Thr Tyr Gly 
355 360 365 

Ser Ser He Leu Ser He Leu Leu Glu Glu Val Ser Pro Glu Leu Val 
370 375 380 

Cys Ser Met Leu His Leu Cys Ser Gly Thr Arg Leu Pro Ala Leu Thr 
385 390 395 400 

Val His Val Thr Gin Pro Lys Asp Gly Gly Phe Cys Glu Val Cys Lys 
405 410 415 

Lys Leu Val Gly Tyr Leu Asp Arg Asn Leu Glu Lys Asn Ser Thr Lys 
420 425 430 

Gin Glu He Leu Ala Ala Leu Glu Lys Gly Cys Ser Phe Leu Pro Asp 
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435 

Pro Tyr Gin Lys 
450 

Leu lie Glu lie 
465 

Lys lie Gly Ala 



440 

Gin Cys Asp Gin 
455 

Leu Val Glu Val 
470 

Cys Pro Ser Ala 
485 



Phe Val Ala Glu 
460 

Met Asp Pro Ser 
475 

His Lys Pro Leu 
490 



445 

Tyr Glu Pro Val 

Phe Val Cys Leu 
480 

Leu Gly Thr Glu 
495 



Lys Cys He Trp 
500 

Ala Gin Cys Asn 
515 



Gly Pro Ser Tyr 

Ala Val Glu His 
520 



Trp Cys Gin Asn 
505 

Cys Lys Arg His 



Thr Glu Thr Ala 
510 

Val Trp Asn 
525 



<210> 28 

<211> 523 
<212> PRT 

<213> Homo sapiens 



<400> 28 

Met Tyr Ala Leu Phe Leu Leu Ala Ser Leu Leu Gly Ala Ala Leu Ala 
15 10 15 



Gly Pro Val Leu 
20 

Cys Gin Asn Val 
35 

Leu Gin Thr Val 
50 

He Cys Lys Asp 
65 

Ala Thr Glu Glu 



Leu Pro Lys Pro 
100 

Tyr Leu Pro Val 
115 

Gly Glu Val Cys 
130 

Ala Glu Leu Asn 
145 

Leu Asp Met Thr 



Gly Leu Lys Glu 



Lys Thr Ala Ser 
40 

Trp Asn Lys Pro 
55 

Val Val Thr Ala 
70 

Glu He Leu Val 
85 

Asn Met Ser Ala 



He Leu Asp He 
120 

Ser Ala Leu Leu 

135 

His Gin Lys Gin 
150 

Glu Val Val Ala 
165 



Cys Thr Arg Gly 
25 

Asp Cys Gly Ala 



Thr Val Lys Ser 
60 

Ala Gly Asp Met 

75 

Tyr Leu Glu Lys 
90 

Ser Cys Lys Glu 
105 

He Lys Gly Glu 



Cys Glu Ser Leu 
140 

Leu Glu Ser Asn 
155 

Pro Phe Met Ala 
170 



Ser Ala Val Trp 
30 

Val Lys His Cys 
45 

Leu Pro Cys Asp 



Leu Lys Asp Asn 
80 

Thr Cys Asp Trp 
95 

He Val Asp Ser 
110 

Met Ser Arg Pro 
125 

Gin Lys His Leu 



Lys He Pro Glu 
160 

Asn He Pro Leu 
175 



Leu Leu Tyr Pro Gin Asp Gly Pro Arg Ser Lys Pro Gin Pro Lys Asp 
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180 185 190 

Asn Gly Asp Val Cys Gin Asp Cys He Gin Met Val Thr Asp He Gin 
195 200 205 

Thr Ala Val Arg Thr Asn Ser Thr Phe Val Gin Ala Leu Val Glu His 
210 215 220 

Val Lys Glu Glu Cys Asp Arg Leu Gly Pro Gly Met Ala Asp He Cys 

225 230 235 240 

Lys Asn Tyr He Ser Gin Tyr Ser Glu He Ala He Gin Met Met Met 
245 250 255 

His Met Gin Pro Lys Glu He Cys Ala Leu Val Gly Phe Cys Asp Glu 
260 265 270 

Val Lys Glu Met Pro Met Gin Thr Leu Val Pro Ala Lys Val Ala Ser 
275 280 285 

Lys Asn Val He Pro Ala Leu Glu Leu Val Glu Pro He Lys Lys His 

7.90 295 300 

Glu Val Pro Ala Lys Ser Asp Val Tyr Cys Glu Val Cys Glu Phe Leu 
305 310 315 320 

Val Lys Glu Val Thr Lys Leu He Asp Asn Asn Lys Thr Glu Lys Glu 
325 330 335 

He Leu Asp Ala Phe Asp Lys Met Cys Ser Lys Leu Pro Lys Ser Leu 
340 345 350 

Ser Glu Glu Cys Gin Glu Val Val Asp Thr Tyr Gly Ser Ser He Leu 
355 360 365 

Ser He Leu Leu Glu Glu Val Ser Pro Glu Leu Val Cys Ser Met Leu 
370 375 380 

His Leu Cys Ser Gly Thr Arg Leu Pro Ala Leu Thr Val His Val Thr 
385 390 395 400 

Gin Pro Lys Asp Gly Gly Phe Cys Glu Val Cys Lys Lys Leu Val Gly 
405 410 415 

Tyr Leu Asp Arg Asn Leu Glu Lys Asn Ser Thr Lys Gin Glu He Leu 

420 425 430 

Ala Ala Leu Glu Lys Gly Cys Ser Phe Leu Pro Asp Pro Tyr Gin Lys 
435 440 445 

Gin Cys Asp Gin Phe Val Ala Glu Tyr Glu Pro Val Leu He Glu He 
450 455 460 

Leu Val Glu Val Met Asp Pro Ser Phe Val Cys Leu Lys He Gly Ala 
465 470 475 480 



Cys Pro Ser Ala His Lys Pro Leu Leu Gly Thr Glu Lys Cys He Trp 
485 490 495 
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Gly Pro Ser Tyr 
500 

Ala Val Glu His 
515 



Tip Cys Gin Asn 

Cys Lys Arg His 
520 



Thr Glu Thr Ala 
505 

Val Trp Asn 



Ala Gin Cys Asn 
510 



<210> 29 

<211> 380 

<212> PRT 

<213> Homo sapiens 

<400> 29 

Met Ala Glu Ser His Leu Leu Gin Trp Leu Leu Leu Leu Leu Pro Thr 
15 10 15 

Leu Cys Gly Pro Gly Thr Ala Ala Trp Thr Thr Ser Ser Leu Ala Cys 

20 25 30 

Ala Gin Gly Fro Glu Phe Trp Cys Gin Ser Leu Glu Gin Ala Leu Gin 
35 40 45 

Cys Arg Ala Leu Gly His Cys Leu Gin Glu Val Trp Gly His Val Gly 
50 55 60 

Ala Asp Asp Leu Cys Gin Glu Cys Glu Asp lie Val His lie Leu Asn 
65 70 75 80 

Lys Met Ala Lys Glu Ala lie Phe Gin Asp Thr Met Arg Lys Phe Leu 

85 90 95 

Glu Gin Glu Cys Asn Val Leu Pro Leu Lys Leu Leu Met Pro Gin Cys 
100 105 110 

Asn Gin Val Leu Asp Asp Tyr Phe Pro Leu Val He Asp Tyr Phe Gin 
115 120 125 

Asn Gin Thr Asp Ser Asn Gly He Cys Met His Gly Leu Cys Lys Ser 
130 135 140 

Arg Gin Pro Glu Pro Glu Gin Glu Pro Gly Met Ser Asp Pro Leu Pro 

145 150 155 160 

Lys Pro Leu Arg Asp Pro Leu Pro Asp Pro Leu Leu Asp Lys Leu Val 
165 170 175 

Leu Pro Val Leu Pro Gly Ala Leu Gin Ala Arg Pro Gly Pro His Thr 
180 185 190 

Gin Asp Leu Ser Glu Gin Gin Phe Pro He Pro Leu Pro Tyr Cys Trp 
195 200 205 

Leu Cys Arg Ala Leu He Lys Arg He Gin Ala Met He Pro Lys Gly 

210 215 220 



Ala Leu Ala Val Ala Val Ala Gin Val Cys Arg Val Val Pro Leu Val 
225 230 235 240 
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Ala Gly Gly lie Cys 
245 

Leu Asp Thr Leu Leu 
260 

Val Leu Arg Cys Ser 
275 

Gly Glu Trp Leu Pro 
290 

Thr Thr Gin Ala Gly 
305 

Leu Gin Ala Cys Val 
325 

Phe Val Glu Gin His 
340 

Trp Asp Ala His Thr 
355 

Ser Ser Pro Leu Gin 
370 



Gin Cys Leu Ala Glu Arg 
250 

Gly Arg Met Leu Pro Gin 
265 

Met Asp Asp Ser Ala Gly 
280 

Arg Asp Ser Glu Cys His 
295 

Asn Ser Ser Glu Gin Ala 
310 315 

Gly Ser Trp Leu Asp Arg 
330 

Thr Pro Gin Leu Leu Thr 
345 

Thr Cys Gin Ala Leu Gly 
36C 

Cys lie His Ser Pro Asp 
375 



Tyr Ser Val lie Leu 
255 

Leu Val Cys Arg Leu 
270 

Pro Arg Ser Pro Thr 
285 

Leu Cys Met Ser Val 

300 

lie Pro Gin Ala Met 
320 

Glu Lys Cys Lys Gin 
335 

Leu Val Pro Arg Gly 
350 

Val Cys Gly Thr Met 
365 

Leu 
380 



<210> 30 
<211> 4124 
<212> ADN 

<213> Homo sapiens 



<400> 30 

atgagagaat 

ctgttccagc 

ccggagaacc 

ctgagcatct 

ctgaacgatc 

gtcccagcac 

cgccatgagg 

gaggtgctga 

acctccgcct 

tacatcatct 

cgcccctcca 

ggtgccgaca 

atcgcgcaca 

ggggccctgg 

gtgtccaggt 

ctgccctgtg 

ctgcgcagcg 

acgctggtgg 

gtggtctccg 

gatcccaggc 

gacgctgcag 

cggcaagcac 

ctgcgcttcg 

cgccaggtgt 



gggttctgct 
caagcctggt 
tgctgggcat 
cagacccgca 
ctcgcctggt 
tcaccagcct 
ttctggaggg 
gcatgatggg 
tagtgctgga 
cctacctgca 
acaccaccac 
aggatgtggt 
tccttaagca 
acctccggaa 
ccctggggcc 
tggggactcc 
cccttccagg 
accgtgtgcc 
aggaagatct 
tcctggtgcg 
ccgaagactc 
tggtggactc 
atagttttgc 
gggagccgct 



catgtccgtg 
gctggacatg 
gcaggaagcc 
gacgctggcc 
catctcctat 
ctcagaagag 
taatgtgggc 
ggagttcctg 
tctccggcac 
cccagggaac 
ggagatctgg 
ggtcctcacc 
gatgcgcagg 
gctgaggata 
ccttggtgga 
ggccgagcag 
ggtagtccac 
caccctgctg 
ggtcaccaag 
agccatcggg 
accaggggtg 
tgtgttccag 
tgacgcctcc 
acaggacacg 



ctgctctgtg 
gccaaggtcc 
atccagcagg 
agtgtgctga 
gagcccagca 
gaactgcttg 
tacctgcggg 
gtggcccacg 
tgcacaggag 
accatcctgc 
accttgcccc 
agcagccaga 
gccatcgtgg 
ggcgagtctg 
ggcagccaga 
gccctggaga 
tgcctccagg 
cagcacttgg 
ctcaatgccg 
cccacagaaa 
gccccagagt 
gtgtcggtgc 
gtcctgggtg 
gagcacctca 



gcctggctgg 
tcttggataa 
ccatcaagag 
cagccggggt 
cccccgagcc 
cctggctgca 
tggacagcgt 
tgtgggggaa 
gccaggtctc 
acgtggacac 
aggtcctggg 
ccaggggcgt 
tgggcgagcg 
acttcttctt 
cgtgggaggg 
aagccctggc 
aggtcctgaa 
ccagcatgga 
gcctgcaggc 
ctccttcttg 
tgcctgagga 
tgccaggcaa 
tgttggcccc 
tcatggacct 



ccccacacac 
ctactgcttc 
ccatgagatt 
gcagagctcc 
tcccccacaa 

cccgggccag 
tctcatgggc 
tggcattccc 
tatctacaac 
agaaaggtac 
ggccgaggac 
gactggggga 
cacggtgccc 
cagcggggtg 
catcctcact 
ggactactac 
cttctccacg 
tgcgtctgag 
gcccgcgccc 

cgsggctatc 

tgtgggctac 
atatgtcctg 
gcgccacaac 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

900 

960 

1020 

1080 

1140 

1200 

1260 

1320 

1380 

1440 



40 



cctggagggc catcctctgc tgtgcccctg ctcctgtcct acttccaggg ccctgaggcc 1500 
ggccccgtgc acctcttcac cacctatgat cgccgcacca acatcacgca ggagcacttc 1560 
agccacatgg agctcccggg cccacgctac agcacccaac gtggggtgta tctgctcacc 162 0 
agccaccgca ccgccacggc cgcggaggag ttcgccttcc ttatgcagtc gctgggctgg 168 0 
gccacactgg taggtgagat caccgcgggc aacctgctgc acacccgcac ggtgccgctg 1740 
ctggacacac ccgaaggcag cctcgcgctc accgtgccgg tcctcacctt catcgacaat 1800 
cacggcgagg cctggctggg tggtggagtg gtgcccgatg ccatcgtgct ggccgaggag 18 60 
gccctggaca aagcccagga agtgctggag ttccaccaaa gcctgggggc cttggtggag 192 0 
ggcacagggc acctgctgga ggcccactat gctcggccag aggtcgtggg gcagaccagt 1980 
gccctcctgc gggccaagct ggcccagggc gcctaccgca cagctgtgga cttggagtct 204 0 
ctggcctctc agctcacagc agacctccag gaggtgtctg gggaccaccg cttgctagtg 2100 
ttccacagcc ctggcgagct ggtggtagag gaagcacccc caccaccccc tgctgtcccc 2160 
tctccagagg agctcaccta ccttattgag gccctgttca agacagaggt gctgcccggc 222 0 
cagctgggct acctgcgttt tgacgccatg gctgaactgg agacagtgaa ggccgtgggg 22 80 
ccacagctgg tgcggctggt atggcaacag ctggtggaca cggctgcgct ggtgatcgac 2340 
ctgcgctaca accctggcag ctactccacg gccatcccgc tgctctgctc ctacttcttt 2400 
gaggcagagc cccgccagca cctgtattct gtctttgaca gggccacctc aaaagtcacg 2460 
gaggtgtgga ccttgcccca ggtcgccggc cagcgctacg gctcacacaa ggacctctac 252 0 
atcctgatga gccacaccag tggctctgcg gccgaggcct ttgcacacac catgcaggac 2580 
ctgcagcggg ccacggtcat tggggagccc acggccggag gcgcactctc tgtgggcatc 2640 
taccaggtgg gcagcagccc cttatatgca tccatgccca cccagatggc catgagtgcc 2700 
accacaggca aggcctggga cctggctggt gtggagcccg acatcactgt gcccatgagc 2760 
gaagcccttt ccatagccca ggacatagtg gctctgcgtg ccaaggtgcc cacggtgctg 2820 
cagacggccg ggaagctggt ggctgataac tatgcctctg ccgagctggg ggccaagatg 2880 
gccaccaaac tgagcggtct gcagagccgc tactccaggg tgacctcaga agtggcccta 294 0 
gccgagatcc tgggggctga cctgcagatg ctctccggag acccacacct gaaggcagcc 3000 
catatccctg agaatgccaa ggaccgcatt cctggaattg tgcccatgca gatcccttcc 3060 
cctgaagtat ttgaagagct gatcaagttt tccttccaca ctaacgtgct tgaggacaac 3120 
attggctact tgaggtttga catgtttggg gacggtgagc tgctcaccca ggtctccagg 3180 
ctgctggtgg agcacatctg gaagaagatc atgcacacgg atgccatgat catcgacatg 324 0 
aggttcaaca tcggtggccc cacatcctcc attcccatct tgtgctccta cttctttgat 3300 
gaaggccctc cagttctgct ggacaagatc tacagccggc ctgatgactc tgtcagtgaa 3360 
ctctggacac acgcccaggt tgtaggtgaa cgctatggct ccaagaagag catggtcatt 3420 
ctgaccagca gtgtgacggc cggcaccgcg gaggagttca cctatatcat gaagaggctg 34 80 
ggccgggccc tggtcattgg ggaggtgacc agtgggggct gccagccacc acagacctac 3 54 0 
cacgtggatg acaccaacct ctacctcact atccccacgg cccgttctgt gggggcctcg 3600 
gatggcagct cctgggaagg ggtgggggtg acaccccatg tggttgtccc tgcagaagag 3660 
gctctcgcca gggccaagga gatgctccag cacaaccagc tgagggtgaa gcggagccca 3 720 
ggcctgcagg accacctgta gggaagggcc ccataggcag agccccaggg cagacagaac 37 80 
ctctgggaca cacaccaagg gcactcctgc aggtggcccg gcctgaggtt cccaggagca 3 84 0 
gcaaaggggc ctgctgagct ctggttaggt tacagctgga ggtgtgtata tatacacaca 3 900 
cacacatgta tatacacata tatatgtgta tgtatatata tgtatatata tatggctttc 3960 
caataaccac ctaaatttta acaaaggttc cttctaagtg gtagaacttg gggtggtatt 4020 
tttaccttcc ttcttcatac tttgctcttt ttcttaaata ctcattaatg tgcatatatc 4080 
attattttca gatgcagcta tcattattcc aaaatacaaa ataa 4124 



<210> 31 

<211> 579 

<212> ADN 

<213> Homo sapiens 

<400> 31 

atgcarwsny tnatgcargc nccnytnytn athgcnytng gnytnytnyt ngcnacnccn 60 

gcncargcnc ayytnaaraa rccnwsncar ytnwsnwsnt tywsntggga yaaytgygay 120 

garggnaarg ayccngcngt nathmgnwsn ytnacnytng arccngaycc nathgtngtn 18 0 

ccnggnaayg tnacnytnws ngtngtnggn wsnacnwsng tnccnytnws nwsnccnytn 240 

aargtngayy tngtnytnga raargargtn gcnggnytnt ggathaarat hccntgyacn 300 

gaytayathg gnwsntgyac nttygarcay ttytgygayg tnytngayat gytnathccn 360 
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acnggngarc cntgyccnga rccnytnmgn 
aargarggna cntaywsnyt nccnaarwsn 
wsntggytna cnacnggnaa ytaymgnath 
ytnggntgya thaarathgc ngcnwsnytn 



acntayggny tnccntgyca ytgyccntty 42 0 
garttygtng tnccngayyt ngarytnccn 4 80 
garwsngtny tnwsnwsnws nggnaarmgn 54 0 
aarggnath 579 



<210> 32 

<211> 633 
<212> ADN 

<213> Homo sapiens 
<:400> 32 

tttctttgcg taaccaatac tggaaggcat 
agttaactcc gccctgaccc acccttcccg 
atcgccctgg gcttgcttct cgcgacccct 
ccctctttta agagtctgtt tgcagcctcc 
gagatatggg ggtggccact ccgttctcta 
agtaactaat tatgggattc tggtctgtac 
ctccaggccc tttttggaga gattaatctc 
cgccggagtg aaaatgcaga cagccttaaa 
ctgttaaccc tgcaccttac tcctgacccc 
ctgcctcatc tcttcccctg ctcgaatgcc 
gagagcttLc caaggccaag aggatccact 



ttaaaggacc tctgccgcct cagaccttgc 60 
atgcagtccc tgatgcaggc tcccctcctg 12 0 
gcgcaagccc acctgaaaaa ggtgagtgca 180 
tggcccagct acgggtgtgc gggtctggct 24 0 
gaattggttc tctgcactag agccttccaa 3 00 
aatgagggtg gcctctaaag acttgttctg 360 
acgtctgcac tctcctgccc tccctccaag 420 
actaaggcat tgcccccaag agattcagtc 4 80 
cactccttat gtcccccatg ataaggcctg 540 
ctgaggtctt cctgagagtt gggagggttt 600 
aag 633 



<210> 33 
<211> 1047 
<212> ADN 

<213> Homo sapiens 
<400> 33 

caggagcttg ccctcttgct gggattccaa 
ggtgggaagt cagagaaggt gcccaccaaa 
ttccaggtct atcatatcct gccttatagt 
ttgagtcttt tagtttagtc ctgcctataa 
ataggtatgg agtctcatag atgaggctca 
tgccaggagc tcatttttcc tgtgatctgt 
tctccttcct tgctgcctga ttgtccccag 
aactgtgatg aagggaagga ccctgcggtg 
atcgtcgttc ctggaaatgt gaccctcagt 
tctcctctga aggtgagcct gggggtgggt 
caggggtact ggggcatgta tgcttgggga 
cagagaatag tacaggacat gtagattcag 
gatcataaga ttgaaaggaa tctctgatgt 
agtgacggat accttgcacc tggcagaagc 
ctgctcatta ttatctgaca gctctggttg 
ttgatatacc aattagccag taatatatag 
taaataaaat aggccaagtg tggtaacttc 
tgaaggtggg tgggatcctt tttgagg 



cgctggctgg agaggagtgg gcagcaggga 6 0 
ggcctattag gtcagtctcc tgtttggaag 120 
ttacaataca cttttgggag attatgtctt 180 
aatgagtagg ataagtgtta tcccaggttc 240 
gggacggggg tgcctcaccc aaggtcacac 3 00 
gatagtttct tttgtcaacc tttttcttct 360 
ccatcccagc tcagtagctt ttcctgggat 420 
atcagaagcc tgactctgga gcctgacccc 480 
gtcgtgggca gcaccagtgt ccccctgagt 540 
ggagaagggg aggtgcgagg gtctggccag 600 
actgtgaaga atttcagaat cctggattcc 660 
acactctttc acaggttcat ggaatctcag 720 
cagcgccagc aacttcctgg tgagggcagg 780 
gtcctggcct tctctgggcc tggtggccaa 840 
gccaatttgg ttttgctgtt aattataaaa 900 
tcactttaga aaacacaagt ggtcaaaaaa 960 
atgcctgtaa ttcccacacc cttaggaggc 1020 

1047 



<210> 34 
<211> 1706 
<212> ADN 

<213> Homo sapiens 
<400> 34 

acagtagatg ccagtgcatt tcaatgcaag tgttagagcc aatcaatggg tagtgactac 60 
ctaaagaatt ttaagactat ggattgagca tgatggctca cggcctgtaa tcccagcctt 120 
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tggaaggtga 
aagtgagccc 
ctgtgtttcc 
aggctgcagt 
atgtatagtt 
aataatacac 
taagatctca 
gaagagctgg 
attttttttt 
atcccatgca 
atgttaattc 
cactgtccct 
gagatggggt 
gatttgtaag 
atctacgaaa 
ccatgctcta 
aggggtggta 
aggctcccac 
agcgaattcg 
atagagagcg 
ctaaagggca 
ttttcctctg 
ctttctacag 
ctggggcaag 
catctgctgg 
catttccaaa 
actctctctc 



aggtgaaagg 
catctctaca 
cacctacatg 
gagtgcagtg 
cagtgtaggg 
tatactcaca 
tccagttaaa 
tatgtttgcc 
accaggtgga 
cagactacat 
ctactgggga 
tcaaagaagt 
ttggagagaa 
ccagtgtgac 
tgggagactt 
cagtgctatg 
gttcatggct 
tgactggcgg 
ttgtgcctga 
tcctgagcag 
tatagcatgg 
ttttgtgttt 
tgagtccact 
cagccctgac 
gctgaccacg 
gcagttaagg 
tttctctctt 



attgcttgag 
aaaaatacaa 
ggaggctgag 
agccatgata 
ggaaaattca 
catgggccac 
aattctatga 
ctggaattta 
tttagttttg 
tggcagctgt 
gccctgccca 
aagtacttag 
gggtctttgc 
ctatcaggaa 
gaacttagat 
gccgtctctc 
gcaatcctag 
tccactggct 
cctggagctg 
cagtgggaag 
catctgccac 
gccaaggcca 
accctcactg 
ctaagggaga 
ttactcatcc 
aatgggaaca 
tttttt 



gccaggagtt 
aattagctgg 
gcaggaggat 
caaaaaaaaa 
catttgatta 
aatgttgcca 
ttaaaatata 
cacttataac 
gagaaggagg 
acctttgaac 
gagcccctgc 
ggaggagaga 
attctccttc 
tcacttatct 
gtgatcttca 
atcttgtgcg 
cagtggctct 
ttcccgcagg 
cccagttggc 
cgtctgggct 
agcagaatgg 
aactcccact 
aaaatcattt 
atgagttgga 
ccgttaacat 
gagtgtttta 



ccagaccagc 
gtgtggtggc 
cgtctgagcc 
aaataaagaa 
ttaatgtctg 
ttcctagaac 
ttgctgcttt 
ctttttcaaa 
tggctggcct 
acttctgtga 
gtacctatgg 
gcgttacccc 
tgcagatctg 
tccgggagcc 
gggcccttta 
gctgttttga 
aggagaaaga 
gaacctactc 
tcaccaccgg 
gcatcaagat 
agcggtgtga 
ctctgccccc 
tgtaccactt 
cagttcttga 
tctctctaaa 
ggacctgaag 



ttgggcaaca 
atgtgcctgt 
caggagtttg 
ttctaagtct 
ccatgggcac 
agactatctc 
tttgaagaca 
cctttgtttt 
ctggatcaag 
tgtgcttgac 
gcttccttgc 
tgtggctaaa 
catgtctctg 
tcagttatcc 
tccatataat 
gaatgggaag 
ccccatcagt 
actgcccaag 
gaactaccgc 
cgctgcctct 
ggaaggtccc 
ctttaatccc 
acattttagg 
tagcccaggg 
gagcctcgtt 
aatctttatg 



180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

900 

960 

1020 

1080 

1140 

1200 

1260 

1320 

1380 

1440 

1500 

1560 

1620 

1680 

1706 



<210> 35 

<211> 633 

<212> ADN 

<213> Homo sapiens 



<400> 35 

tttctttgcg 

agttaactcc 

atcgccctgg 

ccctctttta 

gagatatggg 

agtaactaat 

ctccaggccc 

cgccggagtg 

ctgttaaccc 

ctgcctcatc 

gagagctttc 



taaccaatac 
gccctgaccc 
gcttgcttct 
agagtctgtt 
ggtggccact 
tatgggattc 
tttttggaga 
aaaatgcaga 
tgcaccttac 
tcttcccctg 
caaggccaag 



tggaaggcat 
acccttcccg 
cgcgacccct 
tgcagcctcc 
ccgttctcta 
tggtctgtac 
gattaatctc 
cagccttaaa 
tcctgacccc 
ctcgaatgcc 
aggattcact 



ttaaaggacc 
atgcagtccc 
gcgcaagccc 
tggcccagct 
gaattggttc 
aatgagggtg 
acgtctgcac 
actaaggcat 
cactccttat 
ctgaggtctt 
aag 



tctgccgcct 
tgatgcaggc 
acctgaaaaa 
acgggtgtgc 
tctgcactag 
gcctctaaag 
tctcctgccc 
tgcccccaag 
gtcccccatg 
cctgagagtt 



cagaccttgc 
tcccctcctg 
ggtgagtgca 
gggtctggct 
agccttccaa 
acttgttctg 
tccctccaag 
agattcagtc 
ataaggcctg 
gggagggttt 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

633 



<210> 36 
<211> 1047 
<212> ADN 

<213> Homo sapiens 
<400> 36 

caggagcttg ccctcttgct gggattccaa cgctggctgg agaggagtgg gcagcaggga 60 
ggtgggaagt cagagaaggt gcccaccaaa ggcctattag gtcagtctcc tgtttggaag 120 
ttccaggtct atcatatcct gccttatagt ttacaataca cttttgggag attatgtctt 180 
ttgagtcttt tagtttagtc ctgcctataa aatgagtagg ataagtgtta tcccaggttc 240 
ataggtatgg agtctcatag atgaggctca gggacggggg tgcctcaccc aaggtcacac 300 
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tgccaggagc tcatttttcc tgtgatctgt gatagtttct tttgtcaacc tttttcttct 360 
tctccttcct tgctgcctga ttgtccccag ccatcccagc tcagtagctt ttcctgggat 420 
aactgtgatg aagggaagga ccctgcggtg atcagaagcc tgactctgga gcctgacccc 4 80 
atcgtcgttc ctggaaatgt gaccctcagt gtcgtgggca gcaccagtgt ccccctgagt 540 
tctcctctga aggtgagcct gggggtgggt ggagaagggg aggtgcgagg gtctggccag 600 
caggggtact ggggcatgta tgcttgggga actgtgaaga atttcagaat cctggattcc 660 
cagagaatag tacaggacat gtagattcag acactctttc acaggttcat ggaatctcag 720 
gatcataaga ttgaaaggaa tctctgatgt cagcgccagc aacttcctgg tgagggcagg 780 
agtgacggat accttgcacc tggcagaagc gtcctggcct tctctgggcc tggtggccaa 840 
ctgctcatta ttatctgaca gctctggttg gccaatttgg ttttgctgtt aattataaaa 900 
ttgatatacc aattagccag taatatatag tcactttaga aaacacaagt ggtcaaaaaa 960 
taaataaaat aggccaagtg tggtaacttc atgcctgtaa ttcccacacc cttaggaggc 1020 
tgaaggtggg tgggatcctt tttgagg 1047 



<210> 37 

<211> 1706 

<212> ADN 

<213> Homo sapiens 

<400> 37 

acagtagatg ccagtgcatt tcaatgcaag tgttagagcc aatcaatggg tagtgactac 60 
ctaaagaatt ttaagactat ggattgagca tgatggctca cggcctgtaa tcccagcctt 120 
tggaaggtga aggtgaaagg attgcttgag gccaggagtt ccagaccagc ttgggcaaca 180 
aagtgagccc catctctaca aaaaatacaa aattagctgg gtgtggtggc atgtgcctgt 240 
ctgtgtttcc cacctacatg ggaggctgag gcaggaggat cgtctgagcc caggagtttg 3 00 
aggctgcagt gagtgcagtg agccatgata caaaaaaaaa aaataaagaa ttctaagtct 360 
atgtatagtt cagtgtaggg ggaaaattca catttgatta ttaatgtctg ccatgggcac 420 
aataatacac tatactcaca catgggccac aatgttgcca ttcctagaac agactatctc 480 
taagatctca tccagttaaa aattctatga ttaaaatata ttgctgcttt tttgaagaca 540 
gaagagctgg tatgtttgcc ctggaattta cacttataac ctttttcaaa cctttgtttt 600 
attttttttt accaggtgga tttagttttg gagaaggagg tggctggcct ctggatcaag 660 
atcccatgca cagactacat tggcagctgt acctttgaac acttctgtga tgtgcttgac 720 
atgttaattc ctactgggga gccctgccca gagcccctgc gtacctatgg gcttccttgc 780 
cactgtccct tcaaagaagt aagtacttag ggaggagaga gcgttacccc tgtggctaaa 840 
gagatggggt ttggagagaa gggtctttgc attctccttc tgcagatctg catgtctctg 900 
gatttgtaag ccagtgtgac ctatcaggaa tcacttatct tccgggagcc tcagttatcc 960 
atctacgaaa tgggagactt gaacttagat gtgatcttca gggcccttta tccatataat 102 0 
ccatgctcta cagtgctatg gccgtctctc atcttgtgcg gctgttttga gaatgggaag lOBO 
aggggtggta gttcatggct gcaatcctag cagtggctct aggagaaaga ccccatcagt 1140 
aggctcccac tgactggcgg tccactggct ttcccgcagg gaacctactc actgcccaag 1200 
agcgaattcg ttgtgcctga cctggagctg cccagttggc tcaccaccgg gaactaccgc 1260 
atagagagcg tcctgagcag cagtgggaag cgtctgggct gcatcaagat cgctgcctct 1320 
ctaaagggca tatagcatgg catctgccac agcagaatgg agcggtgtga ggaaggtccc 1380 
ttttcctctg ttttgtgttt gccaaggcca aactcccact ctctgccccc ctttaatccc 1440 
ctttctacag tgagtccact accctcactg aaaatcattt tgtaccactt acattttagg 1500 
ctggggcaag cagccctgac ctaagggaga atgagttgga cagttcttga tagcccaggg 1560 
catctgctgg gctgaccacg ttactcatcc ccgttaacat tctctctaaa gagcctcgtt 1620 
catttccaaa gcagttaagg aatgggaaca gagtgtttta ggacctgaag aatctttatg 1680 
actctctctc tttctctctt tttttt 1706 



<210> 38 

<211> 1043 

<212> ADN 

<213> Homo sapiens 

<400> 38 

tttctttgcg taaccaatac tggaaggcat ttaaaggacc tctgccgcct cagaccttgc 60 
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agttaactcc gccctgaccc acccttcccg 

atcgccctgg gcttgcttct cgcgacccct 

ctcagtagct tttcctggga taactgtgat 

ctgactctgg agcctgaccc catcgtcgtt 

agcaccagtg tccccctgag ttctcctctg 

gctggcctct ggatcaagat cccatgcaca 

ttctgtgatg tgcttgacat gttaattcct 

acctatgggc ttccttgcca ctgtcccttc 

gaattcgttg tgcctgacct ggagctgccc 

gagagcgtcc tgagcagcag tgggaagcgt 

aagggcatat agcatggcat ctgccacagc 

tcctctgttt tgtgtttgcc aaggccaaac 

tctacagtga gtccactacc ctcactgaaa 

gggcaagcag ccctgaccta agggagaatg 

ctgctgggct gaccacgtta ctcatccccg 

ttccaaagca gttaaggaat gggaacagag 

ctctctcttt ctctcttttt ttt 



atgcagtccc tgatgcaggc tcccctcctg 12 0 
gcgcaagccc acctgaaaaa gccatcccag 180 
gaagggaagg accctgcggt gatcagaagc 24 0 
cctggaaatg tgaccctcag tgtcgtgggc 3 00 
aaggtggatt tagttttgga gaaggaggtg 3 60 
gactacattg gcagctgtac ctttgaacac 42 0 
actggggagc cctgcccaga gcccctgcgt 4 80 
aaagaaggaa cctactcact gcccaagagc 54 0 
agttggctca ccaccgggaa ctaccgcata 6 00 
ctgggctgca tcaagatcgc tgcctctcta 660 
agaatggagc ggtgtgagga aggtcccttt 72 0 
tcccactctc tgcccccctt taatcccctt 780 
atcattttgt accacttaca ttttaggctg 840 
agttggacag ttcttgatag cccagggcat 90 0 
ttaacattct ctctaaagag cctcgttcat 960 
tgttttagga cctgaagaat ctttatgact 1020 

1043 



<210> 39 
<211> 1047 
<212> ADN 

<213> Homo sapiens 
<400> 39 

caggagcttg ccctcttgct gggattccaa 

ggtgggaagt cagagaaggt gcccaccaaa 

ttccaggtct atcatatcct gccttatagt 

ttgagtcttt tagtttagtc ctgcctataa 

ataggtatgg agtctcatag atgaggctca 

tgccaggagc tcatttttcc tgtgatctgt 

tctccttcct tgctgcctga ttgtccccag 

aactgtgatg aagggaagga ccctgcggtg 

atcgtcgttc ctggaaatgt gaccctcagt 

tctcctctga aggtgagcct gggggtgggt 

caggggtact ggggcatgta tgcttgggga 

cagagaatag tacaggacat gtagattcag 

gatcataaga ttgaaaggaa tctctgatgt 

agtgacggat accttgcacc tggcagaagc 

ctgctcatta ttatctgaca gctctggttg 

ttgatatacc aattagccag taatatatag 

taaataaaat aggccaagtg tggtaacttc 

tgaaggtggg tgggatcctt tttgagg 



cgctggctgg agaggagtgg gcagcaggga 60 
ggcctattag gtcagtctcc tgtttggaag 120 
ttacaataca cttttgggag attatgtctt 180 
aatgagtagg ataagtgtta tcccaggttc 240 
gggacggggg tgcctcaccc aaggtcacac 3 00 
gatagtttct tttgtcaacc tttttcttct 360 
ccatcccagc tcagtagctt ttcctgggat 420 
atcagaagcc tgactctgga gcctgacccc 480 
gtcgtgggca gcaccagtgt ccccctgagt 540 
ggagaagggg aggtgcgagg gtctggccag 600 
actgtgaaga atttcagaat cctggattcc 660 
acactctttc acaggttcat ggaatctcag 720 
cagcgccagc aacttcctgg tgagggcagg 7 80 
gtcctggcct tctctgggcc tggtggccaa 840 
gccaatttgg ttttgctgtt aattataaaa 900 
tcactttaga aaacacaagt ggtcaaaaaa 96 0 
atgcctgtaa ttcccacacc cttaggaggc 102 0 

1047 



<210> 40 
<211> 1705 
<212> ADN 

<213> Homo sapiens 
<400> 40 

acagtagatg ccagtgattt caatgcaagt 
taaagaattt taagactatg gattgagcat 
ggaaggtgaa ggtgaaagga ttgcttgagg 
agtgagcccc atctctacaa aaaatacaaa 
tgtgtttccc acctacatgg gaggctgagg 
ggctgcagtg agtgcagtga gccatgatac 
tgtatagttc agtgtagggg gaaaattcac 
ataatacact atactcacac atgggccaca 



gttagagcca atcaatgggt agtgactacc 6 0 
gatggctcac ggcctgtaat cccagccttt 120 
ccaggagttc cagaccagct tgggcaacaa 180 
attagctggg tgtggtggca tgtgcctgtc 240 
caggaggatc gtctgagccc aggagtttga 3 00 
aaaaaaaaaa aataaagaat tctaagtcta 3 60 
atttgattat taatgtctgc catgggcaca 420 
atgttgccat tcctagaaca gactatctct 4 80 
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aagatctcat 
aagagctggt 
ttttttttta 
tcccatgcac 
tgttaattcc 
actgtccctt 
agatggggtt 
atttgtaagc 
tctacgaaat 
catgctctac 

ggggtggtag 

ggctcccact 
gcgaattcgt 
tagagagcgt 
taaagggcat 
tttcctctgt 
tttctacagt 
tggggcaagc 
atctgctggg 
atttccaaag 
ctctctctct 



ccagttaaaa 
atgtttgccc 
ccaggtggat 
agactacatt 
tactggggag 
caaagaagta 
tggagagaag 
cagtgtgacc 
gggagacttg 
agtgctatgg 
ttcatggctg 
gactggcggt 
tgtgcctgac 
cctgagcagc 
atagcatggc 
tttgtgtttg 
gagtccacta 
agccctgacc 
ctgaccacgt 
cagttaagga 
ttctctcttt 



attctatgat 
tggaatttac 
ttagttttgg 
ggcagctgta 
ccctgcccag 
agtacttagg 
ggtctttgca 
tatcaggaat 
aacttagatg 
ccgtctctca 
caatcctagc 
ccactggctt 
ctggagctgc 
agtgggaagc 
atctgccaca 
ccaaggccaa 
ccctcactga 
taagggagaa 
tactcatccc 
atgggaacag 
ttttt 



taaaatatat 
acttataacc 
agaaggaggt 
cctttgaaca 
agcccctgcg 
gaggagagag 
ttctccttct 
cacttatctt 
tgatcttcag 
tcttgtgcgg 
agtggctcta 
tcccgcaggg 
ccagttggct 
gtctgggctg 
gcagaatgga 
actcccactc 
aaatcatttt 
tgagttggac 
cgttaacatt 
agtgttttag 



tgctgctttt 
tttttcaaac 
ggctggcctc 
cttctgtgat 
tacctatggg 
cgttacccct 
gcagatctgc 
ccgggagcct 
ggccctttat 
ctgttttgag 
ggagaaagac 
aacctactca 
caccaccggg 
catcaagatc 
gcggtgtgag 
tctgcccccc 
gtaccactta 
agttcttgat 
ctc.tctaaag 
gacctgaaga 



ttgaagacag 
ctttgtttta 
tggatcaaga 
gtgcttgaca 
cttccttgcc 
gtggctaaag 
atgtctctgg 
cagttatcca 
ccatataatc 
aatgggaaga 
cccatcagta 
ctgcccaaga 
aactaccgca 
gctgcctctc 
gaaggtccct 
tttaatcccc 
cattttaggc 
agcccagggc 
agcctcgttc 
atctttatga 



540 

600 

660 

720 

780 

840 

900 

960 

1020 

1080 

1140 

1200 

1260 

1320 

1380 

1440 

1500 

1560 

1620 

1680 

1705 



<210> 41 

<211> 1043 

<212> ADN 

<213> Homo sapiens 

<400> 41 

tttctttgcg taaccaatac tggaaggcat ttaaaggacc tctgccgcct cagaccttgc 60 
agttaactcc gccctgaccc acccttcccg atgcagtccc tgatgcaggc tcccctcctg 120 
atcgccctgg gcttgcttct cgcgacccct gcgcaagccc acctgaaaaa gccatcccag 180 
ctcagtagct tttcctggga taactgtgat gaagggaagg accctgcggt gatcagaagc 240 
ctgactctgg agcctgaccc catcgtcgtt cctggaaatg tgaccctcag tgtcgtgggc 3 00 
agcaccagtg tccccctgag ttctcctctg aaggtggatt tagttttgga gaaggaggtg 360 
gctggcctct ggatcaagat cccatgcaca gactacattg gcagctgtac ctttgaacac 420 
ttctgtgatg tgcttgacat gttaattcct actggggagc cctgcccaga gcccctgcgt 480 
acctatgggc ttccttgcca ctgtcccttc aaagaaggaa cctactcact gcccaagagc 540 
gaattcgttg tgcctgacct ggagctgccc agttggctca ccaccgggaa ctaccgcata 600 
gagagcgtcc tgagcagcag tgggaagcgt ctgggctgca tcaagatcgc tgcctctcta 660 
aagggcatat agcatggcat ctgccacagc agaatggagc ggtgtgagga aggtcccttt 720 
tcctctgttt tgtgtttgcc aaggccaaac tcccactctc tgcccccctt taatcccctt 780 
tctacagtga gtccactacc ctcactgaaa atcattttgt accacttaca ttttaggctg 840 
gggcaagcag ccctgaccta agggagaatg agttggacag ttcttgatag cccagggcat 900 
ctgctgggct gaccacgtta ctcatccccg ttaacattct ctctaaagag cctcgttcat 960 
ttccaaagca gttaaggaat gggaacagag tgttttagga cctgaagaat ctttatgact 1020 
ctctctcttt ctctcttttt ttt 1043 



<210> 42 

<211> 342 

<212> ADN 

<213> Homo sapiens 

<400> 42 

atgacntgya aratgwsnca rytngarmgn 
cartaywsng tnaarytngg ncayccngay 
gtnmgnaarg ayytncaraa yttyytnaar 
cayathatgg argayytnga yacnaaygcn 



aayathgara cnathathaa yacnttycay 60 
acnytnaayc arggngartt yaargarytn 120 
aargaraaya araaygaraa rgtnathgar 180 
gayaarcary tnwsnttyga rgarttyath 24 0 
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atgytnatgg cnmgnytnac ntgggcnwsn caygaraara tgcaygargg ngaygarggn 30 0 
ccnggncayc aycayaarcc nggnytnggn garggnacnc cn 34 2 



<210> 43 

<211> 4195 

<212> ADN 

<213> Homo sapiens 



<400> 43 

ttccaccttt 

tgaatccctg 

gtaattctgt 

ttttacattc 

gttttctggg 

gtcgttttgc 

tatatcttct 

ttttttgttg 

atttgtttta 

aagccagtta 

atcctgggga 

caaagaactc 

ggggtcccag 

aatggctcag 

tggtccatcc 

ggaatggata 

aacaacgata 

agccaggaca 

gccatggagg 

cagtttcagg 

gagggcatgg 

agagcccccc 

ttccgcttct 

ctggttgaga 

aagctgtggg 

atgtctcttg 

gcactttggg 

agagaaagct 

ataaggaagg 

ctggactttt 

tgcacatgtc 

acccttccca 

gacaaggcca 

cctgccatgg 

atgttgaccg 

ctgataaagg 

gagtgtcctc 

tcctggggct 

gctctctctg 

gcagacgtct 

ttcctcat tc 

cacaaagagt 

ataataaagt 

ggtgtggagg 

tacctctcac 

gcccctcatt 

gctgatgatt 

aagaacaact 

tggctcttgg 



tggctcttgt 
cattcaattc 
gtttatttat 
ccactaacag 
ttttaaaaga 
ttcatgtttt 
tcggagaagt 
ttgagttgta 
caaatatttt 
atctgagtag 
attggccacc 
ttcccctcca 
acacaataat 
gcccttgtga 
ccagctttca 
tagcccttgg 
gttttagttt 
ctgttctcaa 
aatgttctca 
gatgtatggc 
gagtgggaat 
tacctgcttt 
cctacctccc 
aacagagact 
cagctggcca 
tcagctgtct 
cttctcttgg 
cagggaggtc 
agagtatcct 
cttgagcaga 
tctgtgtgaa 
ccagaggcca 
tcgcttgggg 
gattccccag 
agctggagaa 
ggaatttcca 
agtatatcag 
gccctgggcc 
agatctttaa 
ggttcaaaga 
tggtgataaa 
agctgagtta 
catcaatacc 
gagggttgga 
aagcctttcc 
tcgagcattg 
ttatagtggt 
gatactgttc 
gaaccttaga 



aaataatgct 
ttttgcatat 
ttgaggaaca 
tgcattaggc 
agtagtagtc 
cctaaagatt 
gtctatttga 
gggattcttt 
ctttgtaaca 
cattttgtta 
tcctcttctc 
ctacctcaga 
taaccaagag 
agtgccgagg 
cagaacagga 
caacaacaca 
ttagtaatga 
cccttttgcg 
ctgagtgcat 
ctgaccacca 
ctggctggat 
ttccttcctg 
cacccaaaat 
gtagcaactc 
agcctaaccg 
ttcagaagac 
ggagggtcag 
tggagcaaag 
ccagcacctt 
gggtggggtg 
tggacccttc 
tagccatctg 
catgaatcct 
aaggttctgt 
agccttgaac 
tgccgtctac 
ggtgaggagg 
agcggtcctc 
actctggctt 
gttggatatc 
gatgggcgtg 
ctgggcccag 
tcatgcctct 
aaacccaaag 
tgctttaccc 
gatttgaggc 
tctgaaatgg 
tctaagctaa 
gtgatagcta 



gctatgaaca 
atacccagga 
aacttgccgt 
ttccaattct 
atccttgtag 
agtaattttc 
gtctttcccc 
tatattctgg 
acagaaacac 
gtggtgggga 

ctcttaggca 
gttagcttcc 
agggtgaaag 
gaccccaagc 
aagctgtgga 
tttccccaca 
gaacaatagt 
gtctttggac 
gcactcaaaa 
atgcagggga 
caagcaagtg 
ggcactattg 
tttcattctg 
tggcagggag 
ctataaaaag 
ctggtaagtg 
ggaagtggag 
atactcctgg 
ccagtgggta 
gtaaggaaag 
cccttcccac 
ctggtttggt 
ctgcgtactg 
ttttcaggtg 
tctatcatcg 
agggatgacc 
ggctgggtgt 
cctgccaccc 
cttcctcctc 
aacactgatg 
gcagcccaca 
aggctgggcc 
ctcttatgct 
gaagaaaaag 
ctcacctggc 
ttaaggattc 
gtcggggatt 
atcttagctt 
catagaagtg 



tgaatgtaca 
gcagaatgat 
tttccataac 
ctatgccctc 
gtgtcaggtg 
atatgcttat 
aattttgatt 
atattaatcc 
accacagtct 
gaggatttgt 
tgaagcgcgt 
tctcttcagc 
gctccctgct 
agcctccatc 
ggagtgtggg 
aagcacccac 
tctcatgact 
cctttgaaac 
tgatgcattc 
ttagcaatcg 
gatgccagca 
cccagcaaat 
cacagtgatt 
aagctgtctc 
gagctgcctc 
ggactgtctg 
cagccttcct 
aggtggggag 
agggcacatt 
tctacgggcc 
acgtgtatcc 
tatttgagag 
ccctggccag 
gggcaagttc 
acgtctacca 
tgaagaaatt 
ggcgggggct 
ttcatagatg 
aatcttgaca 
gtgcagttaa 
aaaaaagcca 
cctggacatg 
tttgtggaat 
aaatctatgt 
ctctgcccca 
aaaaagtcgt 
tgggaacagg 
ccagctacct 
tgtgggtgtg 



aacatctgtt 

ggatcatatg 

agctgcacta 

accaacactt 

gtatctcatt 

tgaccatttg 

ggtttgtttg 

cttatcagat 

tcaaggttgg 

tcctcctgaa 

ctggcttctc 

cagtgatcct 

gtgtttatgc 

tcccagggca 

cagcagggta 

ccaaaagaac 

aaaagccatc 

tctgacagaa 

aacttcaatt 

caatagtgga 

gcccagaaaa 

gccttcctct 

gccacattca 

tgatggcctg 

tcagccctgc 

ggttggcccc 

gagagaggag 

tgaggcaggg 

gtctcctagg 

cccgtgtgtg 

ctatcatccc 

tgcaggccag 

atgcaaattc 

cgtgggcatc 

caagtactcc 

gctagagacc 

ctctgcctgg 

ctatgcctcg 

gaaaaagggt 

cttccaggag 

tgaagaaagc 

tacctgcaga 

gaggttcctc 

tatcccaccc 

cattccttca 

catgaatata 

gtggtagtat 

gtcttagatg 

tgtgtgtgtg 



60 

120 

180 

240 

300 

360 

420 

480 

540 

60O 

660 

720 

780 

840 

900 

960 

102O 

1080 

1140 

1200 

1260 

1320 

1380 

1440 

15O0 

1560 

1620 

1680 

1740 

1800 

1860 

1920 

1980 

2040 

2100 

2160 

2220 

2280 

2340 

2400 

2460 

2520 

2580 

2640 

2700 

2760 

2820 

2880 

2940 
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tctgtgtgtg tgtgtgtgag agagagacag acagaaagag agcaagagag ggaagggggg 30O0 
agaggctgat tgtgtgtgtg gtgtgatgta ggtggacaat gttcagagtc ctccattaac 3060 
aggataatcc tcacacctgt ccacatacct gtagtttgtc cttggggatt ttgaaaattt 3120 
ttcctccctc tccactccca aactcccaac tcaattaaat gataaaggaa taggcaaata 3180 
ggaaaataaa ttagtaaaac ttaagtcaaa gaataggtta ttcatacgct gcctatggga 3240 
ttctatgctt tgtgatcaga aaattatcta aaaaatactt cccaagggct ggtacaaggg 3300 
aggccagaag acgagtggtt cttctctgag gtggacatta aaaaaagaag aaaatgaagg 3360 
ggaacctttt gacaagaatg tcaccccaaa ctggattttc atgctgtggt gtggggaatt 3420 
ttctgttgtc ctcacttagg tgctggggca gtggtgttag tgatgggtaa aaaggtagga 34 80 
agctgtcaca gaatcactaa accagggttc ttaacttgtc tgtctataca tctctgaaat 3540 
tgggttgaag ttgtgtgcat cattttgagt gacgcactga gaacattcct ccacggcttc 3600 
catcgagagt ctcgaaaagg cccaacacct caaaaaggtt aagaacactt gtcctgctta 3660 
ctggttttta gtaacaaatg gcagagtatt tctctctgtc tctctctctt tttttttttt 3720 
tttttttgag acacagggtc ttgtctgtca cgtggactag agtacaatgg gcatgatcat 3780 
gggctcactg tagcctcgaa cacctgggct caagtaatcc tcccacctca gcctctttag 3840 
tagctgggac tacagcatga gccactgccc ttggctaatt tttaaattat ttttttgtag 3900 
agatggaaac ttgctatgtt gcccaggcta gtctcaaact cctggactca agcgatcctc 3960 
ctaccttggc ctcccaaagt gctgagatta cagtgtgatc cacaccacac ctggccaaag 4020 
attggagtat ttttattgct attgttgtgc tgggtgggtg ggtgggtgta tgctttgtgg 4080 
ggacgtgtgt tgttgccaag ggctaaatca gttcctaccc tgctgcccac agtcctccac 4140 
agctttcctg ctctgtgaag ctaaggatac accccgatga taagctgtca acata 4195 



<210> 44 
<211> 477 
<212> ADN 

<213> Homo sapiens 
<400> 44 

tttttttttt ttttttttgg ataaagactt atttattatt tatcttatca tttcccagaa 60 
caaaggccat tgagtaagcc attcccttta aacttggttg ggcagctgtc acatggctga 120 
cctcttaatt acttcccaca gcctttgcca tgactgtggc catgcccacg tgggttgttc 180 
tcatgcagct tctcatgaca ggcaaagatc aactttgcca tcagcatcat acactcctca 240 
aagctcagct gattgtcctg gtttgtgtcc aggtcctcca tgatgtcatt tatgagggct 300 
tcatttctct tctctttctt cataaaaggt tgccaaactg tgcttcccac catttggtct 360 
gaattccttc ttgctcaggg tgtaggggng ggtcttcctt cttaaagtat tgatgaaagg 420 
gggccagatg ggggggttat gctgcgctcc atctgaaaag tggctttggt gggccat 477 



<210> 45 
<211> 406 
<212> ADN 

<213> Homo sapiens 
<400> 45 

tttttttttt tttttttttt ttttggagga agagacttta tttggcccca gcccctagcc 60 
ccacagccaa gacagtttga cataacaggc cccggggccc tggttgggta gaggcagggt 120 
ggcctggcct cctgattagt ggctgtggcc gtggccacca tgactgtggc cgtggccggg 180 
gccactgtga tcttggccac tgtggtctta gggggtgccc tccccgaggc ctggcttatg 240 
gtggtggcca gggccctcgt caccctcgtg cattttttcg tgggaggccc aggttagcct 3 00 
cgccatcagc atgatgaact cctggagctc agctgcttgt ctgcatttgg gtccaggtcc 3 60 
tccatgatgt gttctatgac cttttcattc ttattctcct tcttga 4 06 



<210> 46 

<211> 425 

<212> ADN 

<213> Homo sapiens 
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<400> 46 

ggaggaagag actttatttg gccccagccc ctatccccac agccaagaca gtttgacata 60 

acaggccccg gggccctggt tgggtaaagg cagggtggcc tggcctcctg attagtggct 120 

gtggccgtgg ccaccatgac tgtggccgtg gccgtggcca ctgtgatctt ggccactgtg 180 

gtcttagggg gtgccctccc cgaggcctgg cttatggtgg tggccagggc cctcgtcacc 24 0 

ctcgtgcatc ttctcgtggg aggcccaggt tagcctcgcc aCcagcatga tgaactcctc 300 

gaagctcagc tgcttgtctg catttgtgtc caggtcctcc atgatgtgtt ctatgacctt 360 

ttcattctta ttctccttct tgagaaaatt ttgcagatct tttcgcacca gctcttngaa 420 

ttccc 425 



<210> 47 
<211> 565 
<212> ADN 

<213> Homo sapiens 
<400> 47 

aattcgctcg gctttgacag agtgcaagac gatgacttgc aaaatgtcgc agctggaacg 60 

caacatagag accatcatca acaccttcca ccaatactct gtgaagctgg ggcacccaga 120 

caccctgaac cagggggaat tcaaagagct ggtgcgaaaa gatctgcaaa attttctcaa 180 

gaaggagaat aagaatgaaa aggtcataga acacatca tg gaggacctgg acacaaatgc 24 0 

agacaagcag ctgagcttcg aggagttcat catgctgatg gcgaggctaa cctgggcctc 3 00 

ccacgagaag atgcacgagg gtgacgaggg ccctggccac caccataagc caggcctcgg 360 

ggagggcacc ccctaagacc acagtggcca agatcacagt ggccacggcc atggccacag 420 

tcatggtggc cacggccaca ggccactaat caggaggcca ggccaccctg cctctaccca 480 

accagggccc cggggcctgt tatgtcaaac tgtcttggct gtggggctag gggctggggc 540 

caaataaagt ctcttcctcc aagct 565 



<210> 48 
<211> 430 
<212> ADN 

<213> Homo sapiens 
<400> 48 

gacttggagg aagagacttt atttggcccc agcccctagc cccacagcca agacagtttg 60 
acataacagg ccccggggcc ctggttgggt agaggcaggg tggcctggcc tcctgattag 120 
tggctgtggc cgtggccacc atgactgtgg ccgtggccgt ggccactgtg atcttggcca 180 
ctgtggtctt agggggtgcc ctccccgagg cctggcttat ggtggtggcc agggccctcg 240 
tcaccctcgt gcatcttctc gtgggaggcc caggttagcc tcgccatcag catgatgaac 300 
tcctcgaagc tcagctgctt gtctgcattt gtgtccaggt cctccatgat gtgttctatg 360 
accttttcat tcttattctc cttcttgaga aaattttgca gatcttttcg caccagctct 420 
ttgaattccc 430 



<210> 49 
<211> 305 
<212> ADN 

<213> Homo sapiens 
<400> 49 

tgacttggag gaaaaaactt tatttggccc cagcccctag ccccacagcc aaaacagttt 60 

gacataacag gccccggggc cctggttggg tagaggcagg ggggcctggc ctcctgatta 120 
gtggctgtgg ccggggccac catgactgtg gccggggccg gggccactgt gatcttgcca IBO 
ctggggtctt agggggtgcc ctccccgagg cctggtttat ggtggtggcc agggcccttg 240 
tcacccttgt gcattttttc gtgggaggcc caggttagcc tcgccatcag catgatgaac 300 
tcctc 305 
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<210> 50 

<211> 452 

<212> ADN 

<213> Homo sapiens 

<400> 50 

ggaggaagag actttatttg gccccagccc 
acaggccccg gggccctggt tgggtagagg 
gtggccgtgg ccaccatgac tgtggccgtg 
gtcttagggg gtgccctccc cgaggcctgg 
ctcgtgcatt ttctcgtggg aggcccaggt 
gaagctcagc tgcttgtctg catttgtgtc 
ttcattctta ttctccttct tgagaaaatt 
ttccccctgg ttcagggtgt ctgggtgccc 



ctagccccac agccaagaca gtttgacata 60 
cagggtggcc tggcctcctg attagtggct 120 
gccgtggcca ctgtgatctt ggccactgtg 180 
cttatggtgg tggccagggc cctcgtcacc 24 0 
tagcctcgcc atcagcatga tgaactcctc 300 
caggtcctcc atgatgtgtt ctatgacctt 360 
ttgcagatct tttcgcacca gctctttgaa 420 
ca 452 



<210> 51 

<211> 4439 

<212> ADN 

<213> Homo sapiens 

<400> 51 

atcactgtgg agtaggggaa gggcactcct ggggtggcaa ggtgggaggt gggccctgtg 60 
ttcccacagt gggcagggag gtagtgaaag ggaagctggc cggacaggaa gggccattcc 120 
aagagggctt tgtgcgcagg gctaagccaa gctttctcca taggcaatgg ggagcaactg 180 
gaggttcgta gcaggagaag gacacatcaa gcccaccagg aggctaagta aaaacagttg 240 
tctcccaagt tataagttcc tggaaccctt gctgggagca ggatttagaa aaatgatgct 300 
gagagatgct agaaacatat tcgccctgag gctctctcac tcagactgca agaggaaggt 3 60 
atcatcagaa ttgcccttaa ccaggaacca gaatagctgg gtccccttcc tgccaagtca 420 
gcaaccagct atgtgacctt gctcaggtcc atctccgggt gtcagtttct tcatctacaa 480 
tgcaagaggg ttgcccacct ctgagaaccc ttctaacccc aaatctcacc ctatgaatct 540 
aagaacacaa cccctcgcca tcctaagtat cacagagcca ggcaagcatg ggtgagagct 600 
cagaccatcc ttgttggact aaaaggaagg ggcagactgc catggggggc agccgagagg 660 
gtcaggcccc cataggccct cagcctgctt caacctcaaa ggggatgggg ggctgagtgg 720 
tgccagagga gcagcaggct cgctcgggga gagtagggcc ttaggataga agggaaatga 7 80 
actaaacaac cagcttcctg caaaccagtt tcaggccagg gctgggaatt tcacaaaaaa 840 
gcagaaggcg ctctgtgaac atttcctgcc ccgccccagc ccccttcctg gcagcattag 900 
cacactgctc acctgtgaag caatcttccg gagacagggc caaagggcaa gtgccccagt 960 
caggagctgc ctataaatgc cgagcctgca cagctctggc aaacactctg tgtggctcct 1020 
cggctttggt aagtgagctg ccagcttccc caggcagaag cctgcctgcc gattccttct 1080 
ttccttccct gacccaactt ccttccaaat cctcctccta gaagccctcc ttggttggcc 1140 
ctgcctactt taaagcttct ttcacatttt cttaggtcat gttcccctgg ggcctcctgc 1200 
cctcaaatgc tttgcttttt ggcactctgt agatattcta aaaaatcatt ttgtacatgt 1260 
gtgtgacagg ccatctccca gttaagttgc agcctgtgct ttctttttat tttgcacttc 1320 
ccccactatt tctgtgagtg cttagtagga agtgtcaaag aagcttgaca gcattttctt 13 80 
ctaagtgtcc caactcttgg ttttccatta cacagacaga gtgcaagacg atgacttgca 1440 
aaatgtcgca gctggaacgc aacatagaga ccatcatcaa caccttccac caatactctg 1500 
tgaagctggg gcacccagac accctgaacc agggggaatt caaagagctg gtgcgaaaag 1560 
atctgcaaaa ttttctcaag gtagggctgg actctggcag gtctgaccca gcctcaccgc 1620 
agtttgggtt gacaagggag gatgggagta tgggctacag caatcaaggg gaagatttga 1680 
gctcctggag cccagcccca agacgcagcg agtgtcctgt tatacagggc aggtgctcac 1740 
agttacacag gacgacaggg tcaagaaatt gctcaattga acacctgcta tttgtcgggc 1800 
cctgttctgg gcagagggat gtagtggtaa atgggagccc actattccac gaggagacac 1860 
acagtaaagt tgttggccaa taaagagcac agataaagcc aaatgccaat aagtgcctgg 1920 
aagaaaatga gatagagtgc gctgtgggca atggggctgg gtggggtgga ggtgaccagt 1980 
tagggtacat gagaagggcc tctttgagga ggtaacattt gagctgagcc ccgaatgttg 2040 
gggagggaag cccctgagga tgacacttgg cacaaagctg aggagaccct aagcctcagg 2100 
gcgaacttgg ggtggaagac ttgggggctt ttctaatcct aagggtctgc ggtggaaaat 2160 
gaatgcataa agagcacatg gagagcacct gcacagcact cagggaactg ggaggttttt 2220 
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cccccgctcc aaaaatgatt aggcagttct 
ttttgttttc ttttcaaatt tggggaaagt 
ggaacacatg ggtctcagtc tcagttccag 
ccagccctcc cagtgcccct ccctccgcct 
ttaggggccc tgacagctct ccataggtgg 
gtaggcaaga aagggcccag cagagaggcc 
ctatgcccgc ttcacccccc acctgacatc 
aaggaagcag agcctcatgg atgggctgca 
cacaggttct gggaggggac ttagcgaggt 
ggattacaag catgagccac cctgtccgac 
tgaggtcagc ggagcacata ctctgctctc 
gtttttctag tgtttccccg ttgtattggt 
agagggaagg gaagggaggg caggggaagg 
ctggcctcta agtcagatct gaatttgcat 
tgaccctctc taggactggt ttcaagtctt 
aagttgttat aaggaccaaa tgaggtgaca 
caagaccctg gaactcagct tcctcttcta 
gtcatggagg gaataaactg gagagcgttt 
gcactcagcc tatggtcatt tttaattttt 
tacatttgcc agctggtcat ttactgtgct 
ctcacagcct tctctcccca cccgcagaag 
atcatggagg acctggacac aaatgcagac 
ctgatggcga ggctaacctg ggcctcccac 
ggccaccacc ataagccagg cctcggggag 
cacagtggcc acggccacgg ccacagtcat 
aggccaggcc accctgcctc tacccaacca 
tggctgtggg gctaggggct ggggcaaata 
gcttcttcca cctcttctcc aaccctgcct 
tccttatctg tgactcagcc ccctcattca 
gggtctgtgc tgggcccctt ggctcacctc 
ccccactgtt cagatcccag gctccctgcc 
gcctgacaaa tggcccttgt cactgtacac 
cttgatatgc ctgctacctc accaaccagc 
cacagccctc tctctctcct aacagaattc 
ctagatagtg ccatgtctgg ggaggaatat 
ggtgtgttat ctcacatttg atcagagagc 
atcaacggga gtgctcacac aagtgggagt 



aagaaaaagg ctgagcactt ccaacagcct 2280 
cgggaaacag aggcctgcat taagaagggt 2340 
tcccggagcc agacatcctg gggtaggtcc 240 0 
tggtaaggtg gagaattgca gccttcagag 2460 
aggcctcagg caggcaggat gctgggtggg 252 0 
gcatcggaaa actatcctcc atgtgacccc 2580 
ccccaccaga agcaaagcga tgctgtggga 264 0 
caggagagtg ctcgcattgg ctgggtaccc 2700 
gactcagtgc ctcggcctcc caaagtgctg 27 6 0 
catctcccct tttatacttt atcacaccct 2820 
tgaccctcca tctcccctgc ccacacctag 2880 
tgaaataagt ttcactaatt ggtaacctcc 2940 
agtgaagtgc agaggggtag cagagtggaa 3 000 
gccctcaata gtcaagcctg tgaaaactaa 3060 
cctccaggaa gataccattc ctagctgtta 3120 
tttccaggct tactcatgcc atgaccaggg 3180 
taaatagaga atcagcaccc aagtcacagg 3240 
ggtatgtgct cagtgtctgc tccattgtgc 3300 
aaatccagcc ccagggtcga ggcttccttg 3360 
cccagtcccc acctctggcc acacccagct 3420 
gagaataaga atgaaaaggt catagaacac 3480 
aagcagctga gcttcgagga gttcatcatg 354 0 
gagaagatgc acgagggtga cgagggccct 3600 
ggcaccccct aagaccacag tggccaagat 3660 
ggtggccacg gccacaggcc actaatcagg 3720 
gggccccggg gctgttatgt caaactgtct 3780 
agtctcttcc tccaagtcag tgctctgtgt 3840 
tcccagggct ctggcattta gacagccctg 3900 
gtattaacaa aatgagaagc agcaaaacat 3960 
cctgaccatg tcctcacctc tgacttcagg 4 02 0 
ccatctcaga caccctgtcc agcctgtcca 4080 
tgtagaaagc aaaaaggcat atctctaccc 4140 
cccaagcctg tcttcaccca tcactgtcta 4200 
tattcctctg aaagtcttca gaaactggac 4260 
ggcaccaggc agtggaaaca aggacagatc 432 0 
atgatctctc ttaacagacc tgccacccta 4380 
ctgagagctt agccctatgc ccaccctgg 44 3 9 



<210> 52 
<211> 565 

<212> ADN 

<213> Homo sapiens 
<400> 52 

aattcgctcg gctttgacag agtgcaagac 
caacatagag accatcatca acaccttcca 
caccctgaac cagggggaat tcaaagagct 
gaaggagaat aagaatgaaa aggtcataga 
agacaagcag ctgagcttcg aggagttcat 
ccacgagaag atgcacgagg gtgacgaggg 
ggagggcacc ccctaagacc acagtggcca 
tcatggtggc cacggccaca ggccactaat 
accagggccc cggggcctgt tatgtcaaac 
caaataaagt ctcttcctcc aagct 



gatgacttgc aaaatgtcgc agctggaacg 60 
ccaatactct gtgaagctgg ggcacccaga 120 
ggtgcgaaaa gatctgcaaa attttctcaa 180 
acacatcatg gaggacctgg acacaaatgc 24 0 
catgctgatg gcgaggctaa cctgggcctc 300 
ccctggccac caccataagc caggcctcgg 360 
agatcacagt ggccacggcc atggccacag 420 
caggaggcca ggccaccctg cctctaccca 480 
tgtcttggct gtggggctag gggctggggc 540 

565 



<210> 53 
<211> 255 
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<212> ADN 

<213> Homo sapiens 
<400> 53 

gayaayggng aygtntgyca rgaytgyath 
mgnacnaayw snacnttygt ncargcnytn 
ytnggnccng gnatggcnga yathtgyaar 
athcaratga tgatgcayat gcargaycar 
ttytgygayg argtn 



caratggtna cngayathca racngcngtn 60 
gtngarcayg tnaargarga rtgygaymgn 120 
aaytayathw sncartayws ngarathgcn 18 0 
carccnaarg arathtgygc nytngtnggn 24 0 

255 



<210> 54 

<211> 2724 
<212> ADN 

<213> Homo sapiens 
<400> 54 

cgcgctatgt acgccctctt cctcctggcc 
gtccttggac tgaaagaatg caccaggggc 
gcgtccgact gcggggcagt gaagcactgc 
aaatcccttc cctgcgacat atgcaaagac 
gacaatgcca ctgaggagga gatccttgtt 
aaaccgaaca tgtctgcttc atgcaaggag 
gacatcatta aaggagaaat gagccgtcct 
gagtctctcc agaagcacct agcagagctg 
atcccagagc tggacatgac tgaggtggtg 
ctctaccctc aggacggccc ccgcagcaag 
caggactgca ttcagatggt gactgacatc 
gtccaggcct tggtggaaca tgtcaaggag 
gacatatgca agaactatat cagccagtat 
atgcaaccca aggagatctg tgcgctggtt 
atgcagactc tggtccccgc caaagtggcc 
gtggagccca ttaagaagca cgaggtccca 
gaattcctgg tgaaggaggt gaccaagctg 
ctcgacgctt ttgacaaaat gtgctcgaag 
gaggtggtgg acacgtacgg cagctccatc 
gagctggtgt gcagcatgct gcacctctgc 
cacgtgactc agccaaagga cggtggcttc 
ttggatcgca acctggagaa aaacagcacc 
ggctgcagct tcctgccaga cccttaccag 
gagcccgtgc tgatcgagat cctggtggag 
attggagcct gcccctcggc ccataagccc 
ccaagctact ggtgccagaa cacagagaca 
aaacgccatg tgtggaacta ggaggaggaa 
gtttttttct acttgtgtgt ctgggggaat 
aaaatagggc tcccccacct cccccatttc 
aagggagccc ctagcccctg gcagacatag 
atggatgttg atgcactgga ggtcttttag 
gagagagctc tgctggcatg agccacagtt 
tgaggccttg ttctgagccc tgacatgtgc 
tggcctcctg ccctgatcag ggaccctccc 
gcagcaaaac aaaggcagtt ttatatgaaa 
aaatgatgta attcccactg t:aatagcata 
ggacatcagt ggggccaagg gttctctgtc 
gtctttcctg gtgatgcctt gtttggggtt 
tgcctgaatg taacctgcta gctctccgaa 
ggacagtggt ggccgcgctg tgcctgctcg 
gctgcttcag cctgcacccc tccctttgtc 
aaatatggat ggcaagctcc taggcctctg 



agcctcctgg gcgcggctct agccggcccg 60 
tcggcagtgt ggtgccagaa tgtgaagacg 120 
ctgcagaccg tttggaacaa gccaacagtg 180 
gttgtcaccg cagctggtga tatgctgaag 240 
tacttggaga agacctgtga ctggcttccg 3 00 
atagtggact cctacctccc tgtcatcctg 360 
ggggaggtgt gctctgctct caacctctgc 420 
aatcaccaga agcagctgga gtccaataag 4 80 
gcccccttca tggccaacat ccctctcctc 54 0 
ccccagccaa aggataatgg ggacgtttgc 600 
cagactgctg tacggaccaa ctccaccttt 660 
gagtgtgacc gcctgggccc tggcatggcc 720 
tctgaaattg ctatccagat gatgatgcac 780 
gggttctgtg atgaggtgaa agagatgccc 84 0 
tccaagaatg tcatccctgc cctggaactg 900 
gcaaagtctg atgtttactg tgaggtgtgt 960 
attgacaaca acaagactga gaaagaaata 1020 
ctgccgaagt ccctgtcgga agagtgccag 1080 
ctgtccatcc tgctggagga ggtcagccct 1140 
tctggcacgc ggctgcctgc actgaccgtt 12 00 
tgcgaagtgt gcaagaagct ggtgggttat 1260 
aagcaggaga tcctggctgc tcttgagaaa 1320 
aagcagtgtg atcagtttgt ggcagagtac 1380 
gtgatggatc cttccttcgt gtgcttgaaa 1440 
ttgttgggaa ctgagaagtg tatatggggc 15 00 
gcagcccagt gcaatgctgt cgagcattgc 1560 
tattccatct tggcagaaac cacagcattg 1620 
gaacgcacag atctgtttga ctttgttata 1680 
tgtgtccttt attgtagcat tgctgtctgc 1740 
ctgcttcagt gccccttttc tctctgctag 1800 
cctgcccttg catggcgcct gctggaggag 1860 
tcttgactgg aggccatcaa ccctcttggt 1920 
ttgggcactg gtgggcctgg gcttctgagg 1980 
cgctttcctg ggcctctcag ttgaaccaaa 2040 
gattagaagc ctggaataat caggcttttt 2100 
gggattttgg aagcagctgc tggtggcCtg 2160 
cctggttcaa ctgtgatttg gctttcccgt 2220 
ctgtgggttt gggtgggaag agggcccatc 2280 
gccctgcggg cctggcttgt gtgagcgtgt 2340 
tgttgcctac atgtccctgg ctgttgaggc 2400 
tcatagatgc tccttttgac cttttcaaat 2460 
cttcctggta gagggcggca tgccgaaggg 2520 
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tctgctgggt gtggattgga tgctggggtg tgggggttgg aagctgtctg tggcccactt 2S80 

gggcacccac gcttctgtcc acttctggtt gccaggagac agcaagcaaa gccagcagga 2640 

catgaagttg ctattaaatt gacttcgtga tttttgtttt gcactaaagt ttctgtgatt 2700 

taacaataaa attctgtCag ccag 2724 



<210> 55 
<211> 2171 
<212> ADN 

<213> Homo sapiens 

<400> 55 

cgcgctatgt acgccctctt cctcctggcc agcctcctgg gcgcggctct agccggcccg 60 
gtccttggac tgaaagaatg caccaggggc tcggcagtgt ggtgccagaa tgtgaagacg 120 
gcgtccgact gcggggcagt gaagcactgc ctgcagaccg tttggaacaa gccaacagtg 180 
aaatcccttc cctgcgacat atgcaaagac gttgtcaccg cagccggtga tatgctgaag 240 
gacaatgcca ctgaggagga gatccttgtt tacttggaga agacctgtga ctggcttccg 300 
aaaccgaaca tgtctgcttc atgcaaggag atagtggact cctacctccc tgtcatcctg 360 
gacatcatta aaggagaaat gagccgtcct ggggaggtgt gctctgctct caacctctgc 420 
gagtctctcc agaagcacct agcagagctg aatcaccaga agcagctgga gtccaataag 480 
atcccagagc tggacatgac tgaggtggtg gcccccttca tggccaacat ccctctcctc 540 
ctctaccctc aggacggccc ccgcagcaag ccccagccaa aggataatgg ggacgtttgc 600 
caggactgca ttcagatggt gactgacatc cagactgctg tacggaccaa ctccaccttt 660 
gtccaggcct tggtggaaca tgtcaaggag gagtgtgacc gcctgggccc tggcatggcc 720 
gacatatgca agaactatat cagccagtat tctgaaattg ctatccagat gatgatgcac 780 
atgcaaccca aggagatctg tgcgctggtt gggttctgtg atgaggtgaa agagatgccc 840 
atgcagactc tggtccccgc caaagtggcc tccaagaatg tcatccctgc cctggaactg 900 
gtggagccca ttaagaagca cgaggtccca gcaaagtctg atgtttactg tgaggtgtgt 960 
gaattcctgg tgaaggaggt gaccaagctg attgacaaca acaagactga gaaagaaata 1020 
ctcgacgctt ttgacaaaat gtgctcgaag ctgccgaagt ccctgtcgga agagtgccag 1080 
gaggtggtgg acacgtacgg cagctccatc ctgtccatcc tgctggagga ggtcagccct 1140 
gagctggtgt gcagcatgct gcacctctgc tctggcacgc ggctgcctgc actgaccgtt 1200 
cacgtgactc agccaaagga cggtggcttc tgcgaagtgt gcaagaagct ggtgggttat 1260 
ttggatcgca acctggagaa aaacagcacc aagcaggaga tcctggctgc tcttgagaaa 132 0 
ggctgcagct tcctgccaga cccttaccag aagcagtgtg atcagtttgt ggcagagtac 1380 
gagcccgtgc tgatcgagat cctggtggag gtgatggatc cttccttcgt gtgcttgaaa 1440 
attggagcct gcccctcggc ccataagccc ttgttgggaa ctgagaagtg tatatggggc 1500 
ccaagctact ggtgccagaa cacagagaca gcagcccagt gcaatgctgt cgagcattgc 1560 
aaacgccatg tgtggaacta ggaggaggaa tattccatct tggcagaaac cacagcattg 162 0 
gtttttttct acttgtgtgt ctgggggaat gaacgcacag atctgtttga ctttgttata 1680 
aaaatagggc tcccccacct cccccatttc tgtgtccttt attgtagcat tgctgtctgc 1740 
aagggagccc ctagcccctg gcagacatag ctgcttcagt gccccttttc tctctgctag 1800 
atggatgttg atgcactgga ggtcttttag cctgcccttg catggcgcct gctggaggag 1860 
gagagagctc tgctggcatg agccacagtt tcttgactgg aggccatcaa ccctcttggt 1920 
tgaggccttg ttctgagccc tgacatgtgc ttgggcactg gtgggcctgg gcttctgagg 1980 
tggcctcctg ccctgatcag ggaccctccc cgctttcctg ggcctctcag ttgaaccaaa 204 0 
gcagcaaaac aaaggcagtt ttatatgaaa gattagaagc ctggaataat caggcttttt 2100 
aaatgatgta attcccactg taatagcata gggattttgg aagcagctgc tggtggcttg 2160 
ggacatcagt g 2171 



<210> 56 
<211> 35465 
<212> ADN 

<213> Homo sapiens 
<400> 56 

gatcttggct cactgcaacc tccgcctcca aggttcaagc gatcctccca cctcagcctc 60 
ccaagtagct gggattacaa gcgtgtgcta tcacacctgg ctaattttta tatttttggt 12 0 
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agagatgggg tttcaccttg ttggttaggc tggtcttgaa ctcctgacct caggtgatct 180 
gcctgcctca gcctcccaaa gtgctgggat tacaggtgtg agccaccgcg cccagcctga 24 0 
ccctttcttt ctctactggc aaaactcctg ctccttttta aagccaagct catgtcacct 300 
cctctgtgaa gtcctcgctg actccccaag cggtcagtgt ctctctcgta tgggctcccc 360 
ggcccctgca ctgctctcca tcacaccctg accactctgg gcagtggccc ccctccccac 42 0 
ccactgacta tgggctcctt gaaggcaggg cctgggtctg ccccatctct gtgtccccag 480 
caatgctggg catgagtcag cctcagaaga catctgctga atggctgcaa accagaggaa 54 0 
atatctccag cctcaggctg ggacccctcc cctctctcct cccacctctg acttcatacc 600 
actcaccctc cagagtcttc aatgcccact attacttcac acagtcggcc tgtgacaggc 660 
aatcaggtca tcgtccacgg ctaccaggtg tttcatgtct actgtgactt ccaggaccac 72 0 
aagccctttt gcgcccacca tgtcttcacc taagagatct tcaaagccca gtatgtctct 780 
ggcacccagt ggatcctcca tgcccactgc ggatcccaag cctcctgcct ccttgaagtc 84 0 
caccaaatca gcaacaccca acagatcctt agtgcccacc aaaccagcga catcccgtaa 90 0 
ctcagtcatg agcccaagca gttccaagtc caccaaatcg accagtacaa aaagagcccc 960 
ttctaaccgg cccagcagca ggtcccgagt ccgcagcaaa gcaagaacac ccagcagggt 1020 
gagcaccgac accaggacca gcaaagccag caaggccagc gacgtgagat gccaccagcg 1080 
gaggggcaca cacagccggg gtaggacacc tggcagaagg ggaagccgca gctccaagag 114 0 
gtcacccagc agggccagca ctcctggcag gataagaact catggtgcca gaccaggcat 12 00 
ggccagcagg gtgagaactc ccacttcaca gcaaaaaggg agccggggaa agagttacgg 12 60 
ccggcctaga accagcaaca gggaaaggag tgacagccag cctagaaatc tgagcaagaa 1320 
gagttaccgc ccaccaggag gctcaggtat agggaggagt tccgagctgg ctgtaactcc 13 80 
cagtacagcc aagtgtcaaa ccccgactgg aattccctcc aaggagaaga gtgacaaccc 1440 
atccccatcc tcatcaagga aggtgaagag ctacggtcag atgatcatcc ccagtaggga 1500 
aaagagttac agccccactg aaatgtccag cagggtcaag agttataacc aggccagcac 1560 
ccgcagcagg ccgcaaagtc acagccaatc tagaagcccc agaaggtcaa gaagtggcag 1620 
tcagaagagg acgcacagca gagtgagaag tcacagttgg aagagaaacc atagcagggc 1680 
aagaagtcgc acccggaagg gaattctgag ccagatggga agacacagcc agtctagaag 1740 
ccacagcaag gggaaaagtc aaaaccaatc tagaaccccc agaagaggaa gaagtcacaa 1800 
ctggtctaga aaccccagca aggaaagaag tcatagccat tccagaagct ccagcaaaga 1860 
gagagatcac aggggatcta gcagccccag gaaggagagt ggtcgcagtc aatcaggaag 1920 
ccccaacaag cagagagatc acagccgatc tagaagtccc aacaaggcga gagatcgcag 1980 
ccgatctaga agtccctaca aggcgagaga tcgcagccga tctagaagtc ccaacaaggc 204 0 
gagagattgc agccgatcta gaagtcccta caaggcgaga gatcgcagcc gatctagaag 2100 
tcccaacaag gcaagagatc atagccgatc tagaagtccc aacaaggcga gagatcgcag 2160 
ccgatctaga agccccagca aggaaagaga tcacagccaa cttggaagcc ccagcaaaga 2220 
gagagatcac agacgatcta gaagccccag caaggagaga cagtgcagac aatctagaag 22 80 
ctccagcaaa gagagagatc acagacgatc tagaagcccc agcaaggaga gacagcgcag 2340 
acaatctaga agccccaaca aggagagaga tcgcagccaa tctagaagcc ccagcgagga 2400 
gagagagcac agacaatcca gaagccccag caaagagaga gatcgcagac gatggagaag 2460 
ccccagcaag gagagagagc gcagacaatc tagaagctcc agcgaggaga gagatcacag 2 52 0 
ccgatctaga agccccaata agcagagtgg ttacagtcga cctagagcct ccagcaagga 2580 
gaaagctcat agccgatcta gaacccccag caaagaagga aatcatagcc aatctagaac 2 64 0 
ctctagcaag gagagcgacc ccagtcaatc tacagtcccc agaagtcccg actggaagag 2700 
atcccctact aggacaagca gtctcagtca gaatagaacc cctagcaaga caagcagcca 2760 
ctccccatca acatttccca gtgggggcca aaccctaagc caggatgaca gtcaagccga 2 82 0 
cgccaccacc tctaaggcca ccttacctgg ggaaaggtct tcatcatctt cttccaagct 2 8 80 
ggcgtagccc ccagtctcag ctggctcacg ggtctctgtc atgaccgggg gaggggacag 2 94 0 
gagacaggag cagagcagca gctgagcagc gtccctcccc ggccagctct ccacagccac 3 000 
acctccggcc acaagttctc taatacagga tgttggcagg tagagaggga tgctggatag 3 060 
ggggaaagga aagacctgtg atgattcaat aaatttttac atagcaccca tccccaccaa 3120 
gcccaactgt gtgctcactg ctggcatggg gcacagagga ccccagctct gtccctgact 3180 
gtctacaggg tcttgactgc aagccctgcc cctctctagg tctttttttt ttttgagaca 324 0 
gagtctctct ctgttgccca ggctggagtg cagtggtgtg atctcagctc actgcaacct 3 300 
ccacctccca ggctcaagca attctcctac ctcagcttcc cgagtagctg gaactacaag 3360 
tgtgcgtcct cacgcccggc taattttgta tttttagtag agatggggct tcaccatgtt 3420 
ggccaggctg ggctcgaact cctgacctca ggtgatccac atgcctcaac ctcgcaaagt 3480 
gctgggatta taggcatgag ccaccgcacc cgtccccctc tctaggtctt aatttccgca 3540 
tgtgggcaac aaggctgcct tctggttctt attcagtggg gtagggagag gtgacactcc 3 600 
aaatattcaa cagtggggac tggtgtgggc accaatcaga actgagagtg gagcgggacg 3 660 
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gataccaggc cttaaccctt tagttgctgg 
ttatggggaa aaaaaaccct caaactgtgt 
tcatcaacac agaattctgt gaccaaatgt 
agacaacagc taggtgtccc ctccgattcc 
ttttgtattt ttggaagaga cagggtttca 
cacttcagcc ctccaaagtg ctgggattac 
aaaaaataaa aataaggccg ggcgcagtga 
gccgaggtgg gcagatcacc tgagctcagg 
acttgtctct aaaaaaaaaa aaaaaattac 
atagtcccag ctacctgaga ggctgaggca 
ctgcagtgag ccgtgacctt gccactgcac 
aaaatttttg ctggagctgc tcacagaact 
tattatagag gatattgcaa agaacaaaga 
aaggggcagg gagcttcacg ccctccctgg 
tagctatgcg gaagctctcc aaacccagtc 
gcagcattgg gcatggactt ctctgaaaag 
gaagattaga gtcttgccct ggggcaggaa 
tgtttcttca gacctgcccc aggcctaagg 
aaggctgtag gagttaccag ccaggaactg 
ataccacaag gggggtccaa agtggcagtt 
acaccaaccc atctggaagt attttaatat 
tgattatcag ccttagttct gtatcaattg 
agctgtgtag caccaagcaa agaacttaac 
aggggcttcc aggccttaac tcacgtactc 
gtacagatga ggaaacagac acagaggCga 
aagtggatga actaggattg gaagccagac 
gtttttctga agattcagta ggctcactga 
atcaagagtg gccattacta ctcccacccc 
cctctcatct ctccctgtgc acacaaggcc 
ctgttgctgt caagaatgtc ctcctcctcc 
actttgttgc ccaggctgga gtacagtagc 
gcatcagcct ccctagtagc tgggattaca 
ttttggtatt tttagtagag acagggtttc 
tgacctcagg tgatccattt accttggcct 
accacgccca gccctccttc cccctttttg 
cccaccacaa acataagaac ctctatactt 
aagccttctg tgacttctct ctctccctct 
accccaccac acacacacac cactactgtc 
aagcagggcc agttgatgca gcctcagcta 
gggatacaat ggtggaaaat acatggtccc 
gggactaaag agaaaagctt cagattgaaa 
gcatcattgg cagggcaact tcctaaagaa 
tttcataatt ggcagaggag aattctaatg 
tttgggaatt ctactttata ccaagataag 
acatccaatt aatttttttg tttgtttttg 
tgttgcgaag gctgctgtca aattcctggc 
ttcccaaagt gctgggatta caggcatgag 
atttaatttt cttttttggg acggagtgtc 
gcgatctcgg ctcactgcaa cctctgcctc 
tcccaagtag ctgggactac aggcgcgtgc 
tttttttttt gagacggagt cttgctctgt 
cggctcactg caagctccgc ctcctgggtt 
tagctgggac tacaggcgcc tgccaccacg 
tggggtttca ccgtgttagc caggatgatc 
tcggcctccc aaagtgctgg gattacaggc 
tattttttaa gagacagggt ctcgctcagt 
gtaggaaagg ggcttccagg ccttaactca 
agctcactgt aacctcaaac tcctgtgctc 
ctgggactac aggtatgcgc caccatgcca 



accatgggga ggtctggggt tggggaagtg 3 72 0 
ttttcctcta ctctcacact atcacaacaa 3780 
gtggggcttt ttccccacac actacacagc 3840 
attccaacgc tgtccccaca cccagctaat 3900 
ccatgttgcc cagagctcaa gcaatctgcc 3 960 
aggcgtgagc caccacaccc gactttttta 4 02 0 
cccatgcctg taatcccagc actttgggag 4 080 
agtttgacac cagcctaggc aacatggcaa 414 0 
aaaagttagc cggtgtggtg gcatgtgctt 4200 
ggaggataaa ttgagcctgg aaggtcaagg 4 26 0 
tcaagcctgg atgacccatc ttacaaaaaa 4320 
caaggaaatg cttacttaga tttactggtt 4 3 80 
tgaagagatg tgtagggcaa ggtataaggg 4440 
ggtgctaccc tacaggaacc ctcaggtggt 4500 
ctcttgggtt tttacggagg ctttaagaca 4560 
tgtcttaaga ccaacaatca agaaggtggg 4 620 
atggagggca ggaggaggtc agagagattc 4680 
tacacaacat tataacaaga gactgtaaca 4740 
tggatgaaaa ccaatatatt tatatatata 4800 
agggacaggg agtacttgtg tagcagtgac 4 86 0 
ttaaacaatt ggtatggcta tactagtttg 4920 
gcaagatagt gtctaggttt gccacactct 4980 
ttctctagcc tgtttccttc tctggaagaa 5040 
cccataacta gactgggaat tatctccttt 5100 
taagtgagta gcccaaggtc accatctggt 5160 
ctttcataaa atgatttctc agctcaaaag 5220 
tagaaattgc tggtgtgtgg ctggtattcc 5280 
tgcccctcta taaactccag atgttccaga 5340 
ttttcacatc tgtgggtctt agtacaccca 5400 
tttttttttt tttttttgag atggagtctc 5460 
gcgatctcag ctcactgcaa cctctaccct 5520 
ggcagccacc accaccatgc ccggctaatt 5580 
attatgtcag ccaggctggt ctcaaactcc 5640 
cccagagtgc tgggattaca ggcaagagcc 5700 
gcctggagaa ctccttttca cccttcaaag 5760 
cttgcccgct gaaatactgc ctctgccagg 5820 
tcaccaacgg accgcccccg ccccccacca 5880 
ttccactgta ctccctgaca gtagagaacc 5940 
tatctcttac atgccaaggc ccatgcactg 6000 
ttcaaagtct ggatgtcaag tttaatgctg 6060 
cctggaggtg gctggggcaa aggaccattg 6120 
agcacctaaa tcttggcttt taaagacaga 618 0 
ataccctatt gcctacaggg ccccatctaa 6240 
attgccagat ttagcaaata aaaacagaag 6300 
ggtttttgtt gcggagatgg tgtctcacta 6360 
tcaaacaatc ctcctgcctt ggcctcccac 6420 
ctaccacacc tggcccttat ttatttattt 6480 
actctgtcgc ccaggttgga gcgcagtagc 654 0 
ctgggttcaa gcgattatcc tgccccagcc 6600 
caccatgccc ggcttttttt tttttttttt 6660 
cgcccaggct ggagtgcagt ggcacgatct 6720 
cacgccattc tcctgcctca gccttccgag 6780 
cccgactatt ttttgtattt ttagtagaga 6840 
tcgatctcct gacctcgtga tccacccgcc 6900 
gtgagccacc gcgcccagcc tacttattta 6960 
tgcccaggct ggagtgcagt agggtgatct 702 0 
tgtactcccc cataaccagg ttgggaggtt 7080 
aaggtaccct actagcccct aggagagcag 714 0 
ggcttaattt ttactttttt tttttttttt 7200 
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tttttttgta 
caagcgatcc 
attaatatag 
ttggatataa 
aaccacacac 
gcctacactt 
gtagggccat 
aaggcaaaca 
gatgccccgc 
aaaccttcca 
caggatgcct 
gcctccagga 
ggacactctt 
caaggcggag 
aaaaagaagc 
tcgctcccat 
gcccgggaca 
cccagcctct 
ctagggcgct 
cgcgtcgggc 
ggtttacttg 
tgtgcggggc 
tcggactgga 
aaggcctccc 
cgcagtgatt 
gactgacgcg 
gcacgagggc 
gccccatgct 
cccagtcgaa 
gtgaggaaca 
aaagacttcc 
gaatgggtct 
aaaaatagaa 
aactggagac 
gtcttcctgt 
aggaaaaaaa 
ccgtgcttat 
cttaccccaa 
tgcttttccc 
gatgtcaatc 
agttatggat 
acatggggct 
ggtgtatcac 
tctattaaaa 
tgggaggctg 
attgagccac 
ccagcacttt 
atcctagacc 
tggcaggcgc 
gggaggcgga 
gcgagacttg 
ggtttgaagt 
aatagttctt 
aaagcttcat 
agcaggatca 
tattcaccat 
taaagttaga 
ctaaagagct 
aactttaatt 



gagacggggg 
tcctgcctta 
ctatgttcca 
ttgtttatct 
ctgggacaat 
ttccaagccc 
cccttggttc 
cagtgctgga 
gtgaacacaa 
ctacgggaca 
taggcctata 
cggtcagcgg 
tcccaggatg 
cgctcggttc 
cctcgggtca 
catgcagcgg 
ctcaccggcg 
gcgcctgcgt 
tgcgcggcga 
cgtcgacgag 
gtacagcccg 
aggaacgcgc 
tcctgggccc 
gcactggaag 
agcatatggc 
aagtgggtag 
caggacccct 
ggcggattct 
ggagatacgc 
cagggggctg 
aggaggtggt 
ggcagaatga 
gcgcatgttt 
gggaaatggt 
aagtgacttt 
aaaaatccaa 
ctttctgacc 
actctttacc 
tctgaccttt 
tgagaggctt 
aaatcgggat 
gggcgcggtg 
ctgaggtcag 
ctacaaaaat 
aggcacgaag 
tgcactccag 

gggaggccga 

atttctacta 
ctgtagtccc 

gcttgcagtg 
gtctcaaaaa 
tttccataat 
atcacaatct 
gagggtaaga 
gatttcagat 
ggactctaga 
ataatacatc 
ttgacttggt 
caaagttccc 



tctcactata 
gcctcccaaa 
tgtgatattt 
gaaattcaaa 
caagacattc 
acgtcacaca 
acaagtccca 
gaccccacaa 
taggcacccg 
ataacggcca 
gcgaccacct 
caggtgtggg 
caccaggcct 
tcccaggatg 
ccacggcccc 
ggccgtagcg 
ccggcggccc 
cgcaagtagg 
gacggactag 
acccgcgcgg 
cggcccaaag 
cttacaaaac 
gaggcctgct 
gagtgatttg 
gggggcaacc 
ccttgtcttc 
cccaaccagg 
gtggtttctg 
acctaattag 
tgggagccta 
gatccttaag 
actgcaagcg 
tgattgagga 
tctatagacg 
gtcacat tct 
aaatctttat 
ccacctactt 
agctcgggcc 
gaatacctac 
ttcctgatct 
tggccatgag 
gctcacgccc 
gagcttgaga 
tagccagggg 
atcacttgaa 
cctgggccac 
ggcgggcgga 
aaaatacaaa 
agctactcgg 
atccgagatg 
aaagagtaca 
gacaatggca 
gaactttctt 
atggagtcgc 
tagtgtagcg 
actttgagca 
taaaatgtac 
ctaaaggtga 
ttggagacta 



ttgcccaggc 
gtattggtat 
gggacatact 
tttaactaga 
cctgaagtta 
aggccccttc 
ctcctaccac 
tgccctgggc 
ttccaatgct 
gttcccacaa 
tcccagactc 
ataaaaggaa 
acgactagcg 
ccccagggcg 
agaccgccgg 
cccgcttccc 
ccgctccggc 
gtaggacagc 
tcctgtagcg 

ggggcgccgt 

gaacaagaag 
tgggatgcgc 
tatttgcata 
catattcccc 
tgagcaaagc 
gtaggggatc 
ataaaggttt 
cagtgaacca 
acaactacta 
agaggcgctt 
ccaagtacga 
ccaaggccca 
agcaagagca 
atgttagagt 
ggcttaaaac 
catggcctca 
cctcctccct 
tctgctcttg 
tcttgtgctc 
ctccataata 
ttggtggtgg 
gtaatcccag 
ccagcctggg 
ttatgggggg 
ccctggaggc 
ccagcgagac 
tcacgtcaga 
aaaaaaaaaa 
gaggctgagg 
gcgctactgc 
tgggacgtta 
taccacatca 
tgcttccttg 
cctttttcac 
ctgtctttaa 
gcacctggca 
atgaatgaat 
tggggagcta 
atgtctgggg 



tggtcttgaa 
cactgcaact 
tttctaaaag 
cattgtatat 
ccaggagaca 
cagagtattc 
gcctatggca 
ctatagcagt 
cgagcaaaga 
ttcgttgtgg 
cccgtgtgga 
ccggtctcga 
gaccgactcc 
gcacaaacgc 
ctccccggtg 
ggcatgcctc 
tctgcggcgg 
gcgcaggggg 
ctgtgggaag 
gctttgcccc 
ctgaagggtt 
tgggggtgga 
atcctagcgc 
ggaggggcct 
gcatgcgcgc 
agtttgcatc 
attgatctcc 
tactcctgta 
cccagaaggt 
gccccggcct 
ataggagcca 
gaggccaaaa 
gcttagtatg 
tcaactatgg 
tcccccaaag 
gggctataca 
ccatttctgt 
ccgttccctc 
accattcata 
gcacttacac 
ttgtaactgg 
cactttggga 
caacatggtg 
tgcctgtaat 
agaggttgca 
tctgggtctc 
agatcgagac 
aaaaaattag 
caggagaatg 
actccagcct 
ttgtcctgtc 
ccatactctg 
ttttgagtgt 
tttgggttct 
cacttaacat 
catcgtaaga 
gagaggcctg 
ggcaaaggtt 
tagggggaag 



ctcctggtct 
agcccaaaga 
gttgtatctt 
tttatacggc 
atgcccatca 
cagacgtcag 
gccaaactga 
caattcccaa 
gaccagggca 
cagttcttcc 
agcgctccaa 
caaggatctg 
cacagcgctt 
gtagggggag 
acgggagtcg 
gcgcacccct 
cggctgcacg 
cgtgaagagc 
aggggctatg 
tcgctgcctg 
cgcgcgtgcg 
gggcgctagt 
gggacaatga 
tactccagag 
agggactgca 
ctgagagagg 
taggtgtcag 
ctcacggcac 
cagacctgga 
ctggttctag 
actagaatgg 
aaaaaaaaaa 
cctagaacct 
ctacattcca 
ggatcccatt 
cctggtctgg 
ccagctccac 
cgcctgaaaa 
tcttggtaca 
atttgactgg 
catgaagagt 
ggccgaggct 
aaaccctgcc 
ccttgctact 
ttgagtcgag 
gcctgtaatc 
catcctggcc 
ccgggcgtgg 
gcgtgaacac 
gggcgacaga 
tactcctgtg 
catttatatt 
tttcctcatg 
caatgcttag 
ttgcctgttt 
ggttattttt 
ggatgccaga 
ttgagagttt 
ccagggtaag 



7260 

7320 

7380 

7440 

7500 

7560 

7620 

7680 

7740 

7800 

7860 

7920 

7980 

8040 

8100 

8160 

8220 

8280 

8340 

8400 

8460 

8520 

8580 

8640 

8700 

8760 

8820 

8880 

8940 

9000 

9060 

9120 

9180 

9240 

9300 

9360 

9420 

9480 

9540 

9600 

9660 

9720 

9780 

9840 

9900 

9960 

10020 

10080 

10140 

10200 

10260 

10320 

10380 

10440 

10500 

10560 

10620 

10680 

10740 



56 



ggtccgggcc atggaatggg gtagctcagt cgctatcaaa aagacaagac tgtgactatt 10800 

tggctgaaga aatggccaaa cccaggtttc tggggaggtc gaggtaccct cagtgaggtc 10860 

aggaccttct cctggcctat actgtccacc agcaaccatc acactcctcc ctcccctctc 10920 

ccttagttcc cctcccaatg gtacagccct tgacagcagg acagacacac agccacccca 10980 

aacacttgtt ctctcctcag tttaatggtg gttagtgaga ttgccaaacc ccctccccat 11040 

tcccctcccc accccgtaca aaatgtgtgt gtggtttttt gttttttgtt ttttgttttt 11100 

taacaagaaa aagggggcaa aagccaggaa tggggagagg ggggtgcaat ctgatatttt 11160 

catacagact tttgattttt taatatatta tatataaaac catgaagacc acgaatcctc 11220 

cccaaactcc tttccccctc cccggggggc ctggaggaga gatggggaag gcccccccag 11280 

gagtgggtgg acagagagac aaatatggat gggacagacg ttgggggaga aggtagagag 113 4 0 

aaggggagcc caggaacctg gggaaggggg attggagaaa agggttgggg ctgtctccct 114 00 

cactgccccc atcaaagtta tgacacaaag acacagaatc cctatttcca cgccctcccc 114 60 

ccacccatcc ccccaccgtg caaacatggc tttgcaaaga agtgcccaga gctctgtgga 11S20 

actcttacaa tggctggcat ggggtctagg acccccaaag aaatctgtgt tccccttccc 11580 

tgcccccccc acccttccca gaaactgacc ccctccccac aagacctggt tttgtagcct 11640 

aggggccctg gccttccccc agttatcttc ccccaaccca atccctactg ccctcactgg 11700 

acttgggggg tctggacctt tggcccctgc cccctggggg acccagacct ctgggccctc 117 60 

acttctggcc cttacagaga tccaggcatc caacaccccc atccctgccc aagcgtctga 11820 

ggtgttagtg gtggggggag aagcccacca tcccagactc tggtaaatgt ctttgctggt 11880 

tccttgcagc tggcagtggg ggggacccca gcccaggccc aggcctaggc ctggggtggg 1194 0 

gatagggtca gatgaagaat tcctctttcc tcttgtgtcc gtcgctgcca ttgaggaagg 12000 

cttctcttgc ttctccctgt tcatccaagc cactggcttc gtgggtcaga taggaacctg 12060 

agggggtgac agacccccgg ggcagggggg acatatttgt ggatccagga gttggacaga 1212 0 

agtataaggg aagagggaga cagacaagac acatgccagg cgaaggaaga gggagaaacg 12180 

gaacacacag ggagaggcag agaaagaggt aaacagtggc agagaaagag gtaaaagcag 12240 

' aattaggaag actccaaaag ctcaccgaaa gtgccaccct tatcctttct cttggaggta 12300 

tttccttgcc ctgctcccag cgaattcagc aattaggaaa ataaattgtt ttattcaaat 12360 

ccatgctctt ttcttcccct aattttttgt atttttagta gaaaaggggc tgcgccatgg 12420 

tgcccaggct ggtctcgacc tcctagcttc tcaagtgctt tatccgcctt ggcctcccaa 12480 

cgtgctggga ttacaggcgt gagccaccgc gcccaaccgc aaatctatgc ttttaattca 12540 

gcttctaaat tctacccctt ttcgagtatt gtgccgaaag ccccgccccc tttgtcatct 12600 

ccgcccccgg tgcggcggga tttggaatcc agagcctagg ctccgccctc tcgttaccct 12660 

ggctctaggc cccgcctctt tccgagccct acaaccaacc aaccgtagag tccaggcccc 12720 

gtcccactca cccttctgcc gtaccgagca ccagaccatg cccactagca cacatatgat 12 7 80 

cagaaacacc agcagcgcca ggatgccgcc cacaatggca tagggaaccg acgtctgagc 12 84 0 

ctctaccacc gcaccagggt ctgccagagg gacacggcac aggaccaggt catcagagga 12900 

cgatcccagt ctggccccat cgctgccaag cttttaagcc attctgcaca cgtctaaccg 12960 

tgccctttta tgtgccacac ccctcaaaaa ttactgccac cttgtagtct cttctctttc 13020 

cagatgcttg ttggtttgta cactgcccga cccctcccct gagtcatgtt acattttcct 13080 

tttctttttc ttgttttctt ttgcagagac gggggtctca ctatgtggcc caggctgatc 13140 

ttaaactcct gggctcaagc gatcctccgg cctaggcctc ccaaagtact gggattagag 13200 

gcgtgagcga ccgcacccag ccatcccttt tcttttgact caagtttctt cctccactaa 13260 

gaaacagagt ccaagaaaca ggtccaagtc ccttcccacc ttgtctaaaa cgctccaagt 13320 

atttaaagtg ctgggcccaa ctaccaaaat ttctgcccca ccgtcataga gctaaacaca 13380 

gaacagctgt gtgctagagc ccattccaac caccttacat atttagttca cataatcttc 13440 

acaacagcct tgttatatag gtgctattgt ttatttccac tttactgatg ggtaaactga 13500 

ggcgcagaca ggttcggtta cctgcaatag aatgcagcca acccgaattt gagccccgcg 13560 

ggccagtctg gtcccaaaac aaaaagaact ctgttggctg ccgaacccct gagttatgtg 13620 

gcctctttgc tcaagccccg cccccgccac ctggcgcccc gcccccgccc tcagtcggcc 13 680 

gcagcctgct ctcaccgtag accacaagta cgtagagcgc cctcgcatgg ccgtgcttat 13740 

tggacgcctc gcaagtgtag gtgccgttat ccgcggatac cagacccggc agcgtgagcg 13 800 

tctctcccac ggcctccgcc ctctccggca aagactcatt cccgcggttc cagcggatct 13 860 

ggtttggcct gggtggggat aaagtatagt gagagttagg aaccgaggtg ccagcaccca 13 920 

attctgactt gtcaagaatc tagacatgca actctcatcc cgcagggacc tccaaataag 13 980 

aggcttcctg ctatctcttt cctttctgga aaaccaacag tcctgggcct acttccaccc 14 04 0 

atcaccaagg tctcaggaat tctagcccag gctgaacatg gtggcttatg cctgcaatcc 14100 

cagcacttta ggaggctgag acgggaggac tgcttaaggc cagcagttcc agaccagcct 14160 

gggcaacaca gggagacccc gtcactacaa ttaaaaaata ataataataa taataataat 14220 

tctagccctc ccacgccatt ccatcctcag caaccaggag tctgaggctg cacagcttca 14280 
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gtattgggga gtctgagcct ccagattcct 
agatccctat tcgtccaggt ccccagctct 
tagctccctg tttgtccagg tcctcagctc 
cctggtccct gttcttccag gtccccagct 
gagctcacct ggggttcccc gtgacagcac 
ccacagcttg ggaggcatga atccgggccg 
agagagtagt ttccaagcca tcacgcagga 
ggcgttggga tcccttgggt cctggcccgc 
ctgcgtctgc ttgctgtgtc cggagggcag 
accaccgtcg tccttacggt ccacacgaaa 
gccattttcc tggctgctgc tcactcctgc 
attccggctc catccaccca cccacccgag 
ccacccctta cccacaggcc ccgcctcttg 
gcccacgtgc ctcctcccaa agctcttccc 
atccatttaa ttgctatata tataaaaaca 
ctcacaatgt tgggcaggtt gaactcctga 
aaagtgctag gactacaggc gtgagccacc 
gtccagtgtc tgtgaaaacc tgtggctcct 
cacctcctcc ccatcccttg tcagcactcg 
ccggtaccag cgcagggtgg cagccggacg 
ctcgccgccc tctaccgcct gctcccggac 
cgcagggaga agggaagtaa ggggttaaag 
gctgcctgtt cccagcgacc atagggaacc 
gaggtcagga gccagatgcc catccaggat 
ggagaagaga gaagcagaga agaaaggagg 
tacctagtac cgtgagcgtg gcaatctggt 
aatagccccc ctcgtcctcc aggcgggcat 
agaactcctc aagctggaaa cgctcatcct 
tgaatttcgg gagtcctggc ctcacaagtc 
ccctctgcct cttttctcca gccatatcta 
ttgaggaccc agcattattc aagtcctcct 
ccctttcttc tccgagaccc aggagaccaa 
ggagcctggg ccccagccct ctcttccttt 
ccacgggtgc cattgaagaa gagggtctgc 
ccatcatact ggtgcagacg gcaggtgatc 
ttctctgtct gtacttcctg tcctgcccct 
acttactgag agctgcaatt caattttttc 
tccctctctt tcccctcatt cattccattg 
ggacagggag gaaatctgct ccctactcta 
tgctctaatg agggcagcac agggcacact 
gaattgccta gagagatggg tagccagaga 
gatcttaaag agtaagcagg aggctgagcg 
tgagaggccg aggtgggcgg atcgcaaggt 
gtgaaaccct gtcactacta aaaatacaaa 
tgcgcacctg tagtcccagc tactcgggag 
agttggaagt tgcagtgagc cgagatggag 
agactctgtc tcaaaaaaaa aaagaaagaa 
tgggagactg ctgtgtgttc accaagcctc 
cgtttgcaaa gatagccgta atattctcct 
ttgccattcc tcccattgag aaggcacttt 
gttgctttga ccaatagaat ttgctagaag 
gtagcttcca ctcctgccct aagactgttg 
gatgaacaat catggtgaaa gagaagccca 
tgagtgtggc catcctggat catccagccc 
caagtgaccc cagttgagac caataaaaga 
aaccccagaa tcatgaacaa ataaggtggt 
tctgttctac tgctaaagtt aactgataca 
ctttatagtt aggtggggcc atgtgaccaa 
aacacctctt gcagcctgac ccatctccct 



cctccctcag gatccaggag tccaggtccc 14340 
ctcctcctca ggacccagga atccaggtcc 144 00 
tctcctcctt aggacccagg agtccaagtc 144 60 
ttctcctcct gaggacgcag gaggccccca 14520 
acgtcaacac cagcgtgtct ccctccctca 145 80 
tgggggagtc tgttaggcaa aagtaagagg 1464 0 
caagggggac cctcgcgggt gcgggtggct 14700 
cggtcactta cactgcacat ccagcacgta 14760 
cgcctggttc tgcgcctcac agatgatgat 14 820 
ccgtactgtg cttgccacgc tccagacctt 14 8 80 
cacaccccgg tcagacactg tcaggccaca 14 940 
ccaacgccaa agcaggctat ttgccaagct 15000 
tcctccaagc tacgcccctc ccctaaccaa 15060 
tctttcacgc tcatgctttc tcgtctatca 15120 
taaatttata tatatactta gagacagggt 15180 
cctcaagcaa tcctcccatc tcagcctccc 15240 
gcgctcgaca tcaaccacta catattgaat 153 00 
ctccacatat aaacaacctc tcctaagtcc 15360 
gcccagggta cctttcagct ccttgcggtc 15420 
ggaccgcgga acgaggcagc tgagctccac 15 48 0 
ctccaccaca ggattctctg gggccactgc 1554 0 
aaggcacgaa cgtgggctca aagcgatcga 15600 
agggtcccag gtggcagggg tcaaagggga 15660 
gttaaaaata gccatggtct gaaagtctca 15720 
agaggatgcg tctgacaagg gggagggcgt 15780 
ggtgggtgtc ttctgtgtag agctggcaga 15840 
ctgagagccg gatccgcacc cggcgtgggg 15900 
tcaaggctag agagagtgag ggggaaggtg 15960 
ccacccttcc gacaggagct tagagtccag 16020 
tgagtctgag gtgtccaact atttactccc 16080 
gcctgcagga ccagcagtcc gggaccccag 1614 0 
actctcaggt gtgtcctctt tcaggacatg 16200 
aagactcctg agtctggtcc ccagcactca 16260 
cgggctgggt tctggatgac aactatggac 16320 
tcagccaccc caccctcagc cactgtcacg 16380 
ggacgattag acaaagagac aggatagaag 16440 
tttctccctc ttccccatcc aaacctccaa 16500 
cactgaacat ttcctgcagg ctagagtcca 16560 
aaagagctgc agtcaagatt tagtagaata 16620 
aggagcccag agcaagggag gactattata 16680 
gggctctgca agaaagctcc attggatctg 1674 0 
cggtggctca tgcctgtaat cccagcactt 16800 
caagagatag agaccatcct ggccaacatg 16 860 
aaaaaaaaaa aaattagctg ggtgtggtgg 16 920 
gctgaggcag gggaatcgct tgaacccggg 16980 
ccactgcact ccaggctggg cgacagagcg 17040 
aaaaaagagt aagcaggagt tcacaaggtg 17100 
atctttcaca cctgggcaca tgttgtagcc 17160 
gtccctggac atgccctttg caagttgatt 17220 
gtcccctact agtctgggta agccttgaga 17280 
tgatattgag cctaggcctg aagaggcctt 17340 
catgaagata cccagactag tgtctttgca 17400 
gccggcagcc agcaccaatc gccagctgtg 17460 
cagctgcccc accagctgac agcagccaca 17 520 
tctgcccatc tgatacagcc caaactgctg 17580 
ggttgtttta agctcctaag ttgtgggtga 1764 0 
atacataatt aggctatact tcccagcatc 17700 
ttctggccaa tgggatgtag gtggaagaga 17 760 
cataatcctit cacactggct gaacagagag 1782 0 
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gactccaagg agcctagagg agggcagaat cacaagccag aaggaacctg ggtctctaac 17880 
tgactgtccc ccatgacccg cctgtatagg actgtgatat gagcaagaaa tatacctttt 1794 0 
tgttaagcca ttgagatttc aggggtgtct gttacagcct ttaacctacc ctgattaatc 18000 
catcagaaaa acaaggtggg gaatctagaa ccatcagaga aaagcattta ggaaagctga 18060 
aagccaagac taatcatcag cattaatatc atcatctgtt gtcttcaaaa taacaataac 18120 
ccccatagct accaattatt aggtacttgc agtgttagtc cctgtgctaa gggcattacc 18180 
catataactt acctttaatc ctcacaatcc ctgtgtaagg tagacatgat tattatcatt 1824 0 
attattatta ttttgggaca gagtattgct ctgttgccca ggctggagtg cagtggtgtg 18300 
atctcagctc attgaaacct ccacctccca agttcaagcg attcttcagc ctcagcctcc 18360 
caagtagctg gaattacagg catgcaccac catgccgggc taatttttat ttttagtaga 18420 
gacagagttt agccatattg gcctggctgg tctcgaactc ctggcctcaa gtgatccgcc 18480 
tgcctcagcc tcccaaagtc cagggattac aggtgcgacc caccgcgcct ggccaattat 1854 0 
tattattatt tttaatttga gacaaggtca ggctggagtg cagtggcacg atctcagctc 18600 
actgcaatgt ctgcctccca ggctcgagtg atcccacctc agcctcccca gtagctggaa 18660 
ctacaggtgc acaacatcac acctggctaa cttttgtatt tttttagaga cggagtttca 18720 
ccgtgttgcc caggctggtc ttgaacttgc gagctcaagt gaactgcctg cttcggcctc 18780 
ccaaagtgct gggattacag gcatgagcca ctgtgcccgg cctgcgctat tattatcccc 18840 
attttgcccg gcctgcgcta ctattatccc cattttcccc catttccatt tttcttttct 18900 
tttttttttt tttttttttt tgagacattg tcttgctctg tcgcccaggc tagagtgcag 18960 
tggtacgatc tcggctcact gcaacctcca cttcccgggt tcaagcaatt ctcctgcctc 19020 
agcctcccaa gtagctggga ttataggcac ctgccactgc acttggctaa tctttgtgtt 19080 
tttagtaaag acggggtctc accatcttgg ccaggctggt ctggaactcc tgacctcgtg 1914 0 
atccacccgc ctcggcctcc caaagtgctg ggattacagg cttgagctat cgtgtcctgc 19200 
tcccattccc attttatagg tgagaaaatt ggcccacaga gatgaaatga cttgcccaag 19260 
ttcacagcca agagtggcag tgccaaaatc ttcgtccaaa tctctgattc tgtatcctga 19320 
atctgtatat ccactcctgg ctgtctggat taagtgtcca tcattggcag ggggttgtga 19380 
gagccgcttg tgatgggcct cgaatgccaa cctaggagat ttgctttcat cctaagggcc 19440 
agtgaaggtt ttgaagcagg aatatgccat gattagatct ggctatttgt ctttaagtgc 19500 
tggataacta tccatgtctt ttacattcag gtgctgggtt gcattcattc aggagtattt 19560 
cctgagcatc acgtaggttt tcaggggctg agtagtcaga gatgagttag atgaggtccc 19620 
tgccctttaa gatttatggg aaggtaggaa ccaatcacgg taatcaaaag tgttatgtgg 19680 
ctgggcacgg tggctcacac ctgtaatccc agcactttgg gaggccgagg tgggcggatc 19740 
acaaggtcag gagttcgaga ccagcctgac caacatggtg aaaccccgtc tgtactaaaa 19800 
atacaaaaat tagccaggtg tggtggtggg tgcttgtaat tccagctact caggaggctg 19860 
aggcataaga atcgcttgaa cctgggaggc agaggttgca gtgagccaag atcgcgccac 19920 
tgcagtccag cctgggtgac agagcaagac tccgtttcaa aaaagaaaaa aaaaaaagaa 19980 
ataaataaaa gaaagtgtta tgttttctgt aagagggtag gtaacctaat ttggaagttg 20040 
aggggtagaa aagattattt ctgggggatg gagacagaga cttctggctt cctattctga 20100 
catccatttt tccctttctc ctcagtaaaa gaaaagaaca ctggttgtat tttatggttg 20160 
cactatgtcc agcagaaaaa ggcattcctc agtctccttg cagcaaggta aagccatctg 20220 
ataaaatttt gtccagttgg atataagcca aaatgttgcg tgacaatttt gggaggactt 20280 
cctgaaacag gtggacaaac cctttttcta ctgagtcacc tttgtgccac ctggaactaa 20340 
cagtgtgacg cgtggaattt aggcagccat attgaaccat gaggacaaga gcagtgggga 20400 
tggcggaacc aagagctgga aggtgcctga gtctctggtg aagatgtgga gctgctgtaa 2 04 60 
cagccctcaa ctcctagttc tggacttctt ttatgtttta gtgtaacgct ttgggtattt 20520 
ttattttttt aatttatttt agagatgagg tctcactatg ttgcctaggc tggactcaaa 20580 
ctcttatgct caagcagtcc tcctgcctca gcttcatgag tagctgaaac tatagcactt 20640 
tgggtatttc agccactgtt tgaggttttt ctagcacctc ctggaatatc aagcttaaca 20700 
tgtccaatcc ttgccccaga tattttcctc cccaaatttt ctcaatctca ataaatgtca 20760 
ccaccatcca cctggttgct caggtcaaaa acctagaaat cattcaagtt ctctcccttt 20820 
ccctcatccc caatatccat tccatcagca acatctgtcc attctacctc caagacatat 20880 
cccagatctc atcacctttg tctgcctctc ctaccctcac tctcatccag catcatccct 20940 
cacctggact ctgcaaaagc ctactcgtgg gtctgtctgc atccctgtct gcctcctcca 21000 
gggccattct ccacccagtg gccggatcga tttttcaaag aggtaaatca gatcaattca 21060 
cctttctgct taaaaccctc cgagggctgc ccgtaacatg tagaataaaa tagagacccc 21120 
ttcccgggga cttcaaggtg ctatatggcc tggccccttg ctgaccttac ttcactctgg 2118 0 
gctcgctagc cttgctgtcc ctcaaacatg ctgagctcgc tcccaccaca gggccttttc 21240 
ccttttcttc cttctgcctg gaatgttctt ctccccacct cccaagcccc atcttcccag 21300 
ggctgactcc tgttcccatt tgggtctcaa atcatatcag taccttctca gagaggcctt 213 60 
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ccctcactgc tcatcccttc acctttagaa 
gcccagtgcg gtggctcacg cctgtaatac 
tcacctcagg tcaggagttc aagaccagcc 
aaaaaaatac aaaaattagc taggcagtgg 
aattgcttga acccaggagg cagaggttgc 
acctgggtga cagagagaga ctctgtctca 
ttgctctgtc acccaggctg gagtgcagtg 
tcctgggctc aagccatcct cccacctcag 
cccaccacac ctggctaatt tttgtgcttt 
aggctggtct ccaactcctg gggtcaaagg 
ggattacagg cgtgagccac tgcgcctggc 
tttatttctt ctatgaagat ttcactggaa 
gtctgtttgt cacccatgac tggaatgtat 
ggtttactgc tgcaccccta gtacccagaa 
aacttgctac atgaattaca tgtgtcagat 
tttctttctc tctttctctc tctctttctt 
taaggtctcg ctctgtcacc caggctagag 
cttgaacatg tgggctcaag cgatcctccc 
gaggtgcgta gctatgccca gctaattaaa 
tgggggtctc aatatcttgc ccaggttggt 
gccttggcct cccaaagtgc tgggattata 
aatctcattt cagcccgaca actttgtgac 
gatcccagct caaccacttg ccatctgtgt 
agcctcagtt gccccatcta taaaatggga 
gccccgctcc tgaagctcag ggagccctct 
aacatgccca tgcatgtgaa aactggcatg 
agcctatcca cagatcctgg acctcaagac 
tgtggagaat gaggcttagc gggtcccagg 
ggagccatca ggttcctctg gatctgcccc 
gggtgcacat ggggtgaggg tgggggtctt 
cagtaaccaa cagtgtctgt gcctggaata 
ttgggggtgg tgggggcggg actttctggt 
cactggccct ttaaactgtg ttgacagcca 
ggggacaggg agggtttggg aaagagtggc 
cagcccccaa ctacctcctc tcccaggacc 
tcaggttcca ggagtctgga accccggctt 
ccaaccacct cctctctcag gttcccgaaa 
acccaggagt ccgggctgtc agcagcccct 
ccctctccta gcttagacac aggagtctgg 
ggagccaggg gtccagagta cacagctggt 
99ggagcgct tcctgggtcc tgagtcagcg 
ccgggaaggt caccaccacc ccctctgtat 
ctccttcccc cttcctccct tagggaggtg 
tcagcccccc atcaatggcg gagtccgaac 
gctcagcctt gtgaaggcgc ctgtattcgc 
ctccctcaga aacctgcagt ggaatccccc 
9gagtctgta tcctcatccc ttcctccctc 
ttttccttcc ggacacagga gttccagccc 
ctaagacccc agcctcctcc tccctcaaac 
cctcagactc aggagtctaa gatcccaggc 
ccccaggccc ctcctccctc agactcagga 
acccaggagt ctaagacccc agcccctcct 
ccctcctccc tcagactcag gagtctaaga 
cctaagacct cagccccctc ctccttgaga 
cctttagacc cattagtcca ggcccccaga 
ccccagcccc tcctccatca gatccagccc 
ccccagtcct caacccctag aagcacagtc 
atctggggac ctaggcatca ggtgggggcg 
gtccccgctg tggcccccac attcctggga 



cactttcttt tcttttaaga gacaaagtca 21420 
cagcactttt gagaggccaa ggcgggcaga 214 8 0 
tggccaacgt ggcgaaaccc cgtctctact 21540 
tagcccgggc tactcaggag gctgaggcag 2160 0 
agtgagccga gattgagcca ctgcacccca 21660 
aaaaaaaaaa aaaaaaaaag agacagggta 21720 
gtgcaatcat ggctcactgc agcctcgaac 21780 
cctcctaagt agctgagatt ataggctcct 21840 
ttgtggagac acagattctc catgttgccc 21900 
atcctcctgc ctcggcttcc caaagtgctg 21960 
ccagaacact tgctatttcc tcaccattgc 22020 
ttatcagatt aatttgctta tttgtttact 22080 
actctaggaa ggcagggata taatccaatg 22140 
gagtgcttgg cacctgataa gtgtctgggg 22200 
gggatatctg ttcgtctttc ttctctcttt 22260 
tctctttctt tcttttttct ttttttgaga 22320 
tgcagtggtg caatcatggc tcactgcaac 223 80 
acctcaggct accaaatagc taagactaca 22440 
aaaaaaaaaa tttttttttt tttttagaga 22500 
cttgaactcc taggctcaag caatccccct 22560 
ggcatgagcc attgcagctg gcccagacag 22620 
atcattattt tcatcttaaa cacctaggtt 22680 
gacctgtggg caagtgacct tacctttcgg 22740 
atgatgccag tgcctgcctc ataaggatga 22600 
ctgcaaggct gttttagtgc aacctccgga 22860 
cacattctgg tgcttttaaa aacatctcga 22920 
tggttcagtg ctagcccccc attttacaga 22980 
caagtcagtg gcaaaactca ccatctcctg 23040 
caccaaattt atcccctgct ctctgcttga 23100 
ttgttttact ccctccccct cctgaggagt 23160 
ttaatgtctc agcagctttt gtttgggggg 23220 
cagagagggg ctgagctttg gggactgagg 23280 
ggagtcgtca tggggatggt gcttggaaaa 23340 
ggagcaggta atgcgtaaga cccaggaatc 23400 
caggagtcta ggctcccagc ccctcctcca 23460 
ctttccgcct tagacccagg aattcagccc 23520 
tccagacccc tagccccctt ctcgatcagg 23580 
tccttcaaac ctaggagtca gagcccccag 23640 
gcctccagcc ccctcctcct tcaggaccca 23700 
ggatgtttcc acggagacta agcagggtgg 23760 
aatacccaag ggagtctcaa ggtcatagtt 23820 
ccgctcccca gggggctcct ggcatcctgc 23 880 
gtacatccct gcgtcctgac tgaacccccc 23940 
atcctcgcac aaagcgtcaa ttcttcccca 24000 
aggacctagg cgtcagggtc tcagcccctc 24060 
gcctccagcc ccttcctccc tcaggaccca 24120 
aagacctagg agtgtggact cccagccccc 24180 
tcggccctct cctctcttaa acccaggggt 24240 
tcaggagtct aagatcccag gcccctcctc 24300 
ccctcctccc tcagactcag gagtctaaga 24360 
gtctaagatc ccaggcccct cctccctcag 24420 
ccctcagact caggagtcta agaccccagc 24480 
ccccagcccc ctcctccctg gacccaggag 24540 
cccaggagtc taagacccta gctccctcct 24600 
ccctcctcca tcagacccag gagtccaggc 24660 
ctcctctcct gaaaactttt gactctaact 24720 
ctgcctttcc tcaatcctct gtcccctccc 24780 
taggggtgag tcagcaacct cacacacaaa 24840 
tattcgggac tccctggatt ccaggcctca 24900 
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ggcccagcca 
aattcctgct 
cccagtgccc 
gccccactgg 
acaggcggaa 
tctgactgtc 
tccaagatgg 
ctgtgtctaa 
cacaggcgcc 
ctgttccttg 
cagaatttta 
aactgccccc 
ggatatctgt 
ctgcctgggt 
ccaccctgga 
atgaaccagg 
attcctgctg 
aacagatacc 
agcaggaagg 
ggaaagtaag 
taaggcttgg 
cagtttctac 
agggtgccag 
ccagaagcac 
atcctgagaa 
caagatccag 
catgctaaca 
attctagaat 
ttcattagtt 
aattgatgga 
ttgtaaagaa 
agaaagacag 
ctcaaaccct 
tctgagctgg 
aacagaagcc 
caagatttaa 
tctgccgaac 
caaaagtggc 
gtgagagtgt 
tcgggggtct 
cctggacagg 
gagaggcatt 
cccacacaca 
aattcctctt 
gatcccggga 
agatagtggg 
gacagaaaga 
acagaaaaac 
agggcagaaa 
gaaaagggga 
accgaggcaa 
tagaggacaa 
agggacgcag 
gtgtaggggg 
ctgcggcacg 
ccgcgctgcg 
tctgcggccc 
gccgaccccg 
gccactggaa 



gggagtgggg 
ccgggaaggg 
tctattcacc 
gtgcccacgg 
atcagtgggt 
tccaggccac 
ggacaggcca 
ggtcttggaa 
tggctcatgg 
gggtgactca 
gcaggaaaaa 
tccacaagac 
ttcctctcct 
gcatccctgg 
tccttctttg 
agagagagaa 
gctgggcaag 
ccctaaaatg 
gccctccaag 
gcccagagag 
acccaagttc 
tggtaaaagc 
gaagcagtga 
cagagaaagg 
ttcaaagtct 
gaactccaag 
ccatcacggt 
cctgtagatg 
ccaggattct 
aatgtcactg 
aggaggtaat 
tgagaggaca 
ggagtgggga 
cgttcccttt 
tggagagagg 
gcccaggccg 
acccagccct 
cttatccacc 
gtgtgggtga 
ccagcttctc 
ggcttctctg 
cgctgaatcc 
tgcacacaga 
caggggcaca 
tggaggctgt 
acagagaagg 
caggggacag 
aagggtgaca 
tccgggggaa 
cagagaccag 
gaagagaggg 
gggtaggggg 
agactggaca 
gtctcgggcc 
gcggccgggc 
ctttgtcccg 
cgaggctgcc 
gcccccgacc 
gcgccgggcc 



agtcccccag 
tgcaggcctg 
ccctcttccc 
aggagcctgc 
gcttccgttc 
cccccacccc 
ggctcgcacg 
tccactgcag 
gtgggtgggt 
caatggaggg 
gtgagtcacc 
ccctcaactc 
cctttctgtt 
gcaggcaacc 
ggcataaatc 
catgttttta 
gtgagagagg 
tggtagccaa 
accacatgct 
ggacaaggac 
cttagctccc 
cacatactat 
cttggaaatc 
cttttgcacg 
gatgattcta 
acatcaagat 
tctagaactt 
tcagcattct 
atgagcctgg 
aggtaccaaa 
gatgcaagtt 
gctttgcccc 
acatgtaacc 
catgtcactg 
aaggtgttta 
ccagccccat 
cctgcttctg 
agggaggggt 
catttcctga 
acagtgtgtg 
tgagtcaagc 
acgtgtgtgc 
tgttcccctc 
gagggataga 
aagcgtagag 
gggaaagaga 
agacaagggg 
gcgagacaga 
agagaataga 
gggacagagg 
agacagacag 
acgaggagcc 
gaaggacagc 
ctttgtcccc 
cccgcgcccc 
gggagggggc 

gggctgtcac 
ctacctggcc 
cggcccatgg 



aggtcctccc 
cactgagctc 
agaagagccc 
gtgcctgctc 
tgatgccaca 
tcccagagag 
acattaaccc 
aacctgaccc 

gggggggtca 
agggtccccc 
ctgggaagga 
ctaatagcct 
ctacccagtt 
catccctccc 
tcatcttctt 
aaatggcgca 
aagaagtgac 
ggccactgag 
acagcctcct 
tgatgcaaaa 
agctgagagc 
ttactttaga 
aaacgaggga 
gggcgggtgg 
agctgtcagg 
ttcacgattt 
taaaggtgtc 
aaagtaccat 
tgtttagcct 
gttctcatct 
ctaaagcagt 
tcatcctggc 
gcactcaact 
agttcaacat 
ccattggctg 
gccacctggt 
cctagccacc 
gacccgtggc 
ccttgtcccc 
atgagggtat 
ctgggtgtgt 
ctacacgcca 
cagggctctt 
gagagggagg 
ag^ggaggca 
caggtgacag 
atggggcaga 
gacagggacc 
caggatgatg 
taggggacaa 
aaggagggac 
agacgggggg 
gggaccggcc 
gccgggatcc 
ctcccccgct 
ccggcccggc 
cacagcgcgc 
ccgccgcggc 
tgccgccgcc 



tgggtgtggg 

cctctgtccg 

aggctcagca 

cctatgggcc 

ggccattgga 

agaaagctgc 

agccttaggc 

ccacccccag 

gtgatagaaa 

tattctcaag 

aacattattt 

ctctattctt 

tctggctgcg 

tcttgctttc 

ctgctatgct 

aatgcacccc 

taagagagaa 

aaatatccaa 

accccatgct 

ttatactaaa 

tcttcccatg 

gaaagtttac 

cagggctgta 

tcaccttaag 

attctaaatg 

ttaagacgtc 

aagattctaa 

caggttcttt 

aaaaaataaa 

gggaaattgt 

cacagaagac 

cgaggtgagg 

tgccagaaac 

cctcacttta 

cgatggcaaa 

tataactcct 

ttccaatcct 

aggttcaaga 

attctcaggg 

gtggatggct 

gaatgggtga 

aggtccccca 

tagaatgccc 

aaggtaggat 

cagcagaaag 

aaagggttag 

taggggacag 

aagaataggg 

gaggggacag 

agacagaata 

aggacttcga 

gttcagagac 

tggggagggc 

agcctgcgcg 

cgtcgctccc 

cccgcgcgca 

cccccgcccc 

cgcccacagc 

gccgccgccg 



gtacgagagg 

aacctccacg 

cctgcccctt 

tggggtctgc 

tgctggcggg 

ctttgtgttc 

cccagccctg 

gctctgggga 

cctccaaaac 

agtggctggt 

agggaccaac 

tctttgtatt 

ggtcccattt 

tctcctctgc 

cagaagatga 

atctcccccg 

atgtgggaac 

tggaaaggag 

ttacagaacg 

gggtcctggg 

acaccaagct 

agagagggtt 

gacctaactc 

ctatattctg 

tcatagatgt 

aagatgctag 

agccttctgg 

atttactgga 

gataaattaa 

ggcatgtctg 

tagagaagaa 

atggctctgc 

cccttcacgg 

cagaaagaga 

tggcaagagc 

ctcaccaatc 

ctgttccttc 

cttacacagt 

tcacccaacc 

ccctggatgt 

gcagggtttg 

ttctcacttc 

tgcctgactg 

gggaatggga 

acagggatgg 

agaaacgagt 

agaaaaaggg 

gcagagaggg 

agtgacccag 

gatgaggaac 

gactgaggga 

gggcggacag 

ggacttgtgt 

ggtggggggg 

ggctcccggc 

ttgttcggcc 

agcccggccg 

agcagcagcg 

ccgctcgctc 



24960 

25020 

25080 

25140 

25200 

25260 

25320 

25380 

25440 

25500 

25560 

25620 

25680 

25740 

25800 

25860 

25920 

25980 

26040 

26100 

26160 

26220 

26280 

26340 

26400 

26460 

26520 

26580 

26640 

26700 

26760 

26820 

26880 

26940 

27000 

27060 

27120 

27180 

27240 

27300 

27360 

27420 

27480 

27540 

27600 

27660 

27720 

27780 

27840 

27900 

27960 

28020 

28080 

28140 

28200 

28260 

28320 

28380 

28440 
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ccggcccggc acctgcaccg cccgcgccgc 
ccgcccgggg gcggggcgcc gaggccgggg 
gagaggcccg gagacaatcg gggggacggc 
ctggagagga gaggggtgag gagggcggga 
ggagcaggtg ggggatctcg gtgagcgcgg 
gtgcgggccc aggtgctgcg cgcgagggtg 
tgcgcggagg ggagggtggc agggtgttgc 
gtcgtggggt gcggtgtgtg cgaagggaga 
gagggagtgc gacgtgggaa aggtgagtgt 
ggagtctagc gagaggctgt gagctgagcc 
ccggagggtc cggaggtcga ggcaggtcaa 
tcaggagtgg ggtggggtca gttccctccc 
cgtgtttccg cgtcattctc cgggaggggc 
ctgaatcctg ggtcccagga gggagaggct 
cctctcctcc ctgctgtctc cctgccccag 
tctgcccttc ctctctcccc atctttgagg 
ctccctcctg ggagtgggtt tccctgagcc 
gggatcatta cctatgggac ccagaaagag 
ctctcatgcc catttgtcag gcaaactgag 
cttcccccct cccccctccc cgcccagacg 
cagtggcacg atctcgactc actgcaacct 
ctcagcctcc cgagtagctg agattacagg 
atttttagta gagacggagt tttgccatgc 
aggtgatcca tctgtctggc ctcccaaagt 
ggctgaaaat ccttactttt tattccgact 
cttcagcttc acacaccctt tctgtcctca 
caaaaccata gctaccatca acccttgtgt 
gtcctcaggg tccaagctcc catcaactcc 
ctctctgtcc ttcaggtcca agctcccatc 
gcatcctctc tgtcctcagg gtccaagctc 
ctccagcaat cctctctgtc ctgagagccc 
ccatagccct gagcaacttc cttctttttc 
gggaagagat agtctctaat cctctttcca 
ggagaggaat gtttgatctg cctttggaat 
tttcccgcag gagccaatag gcccgctcac 
gctgaagggg aaccttggga gatgttggtt 
cattccatgt gaagacatca caagagtagt 
taatcccagc actttgggag gccaaggtgg 
cagcctgacc aaccggccaa catggtgaaa 
ttagcaaggc gtggtggcac gtgcctgtaa 
aatcccctga acttgggagg cagaggttgc 
gcctgggtga cagaatgaga ctcagtctaa 
ataataataa taaatagaat agtggtcctg 
ttagggattt agtgcaagtg acagcaagtg 
ggttcacaca taacaaaaag tccttctatg 
tcctaaggat gcatggctcc cctcctgtag 
gattcatatt tggggtgatt aagattctgc 
ttttcaattg ttgcctgtcc ctggtgagac 
actttcaata acaccgtttt tgcttaagtc 
aagattcctg aacaacaact tcagagccgt 
tataggacgt gagaaatttg tccctagcct 
gtatttctat cctctgatcc ccactgtagg 
atctctgcca tagagtttca taggcaatgc 
atgggaaagg tgaaattatc ctcaattata 
gcctcatctc tgctgtaggg catcatggga 
gttgccatag aagatgcagt ctttccttcc 
tttttttttt ttttattatg tagagacagg 
gaactcctgg gctcaagcag ttctcctgcc 
aagagccatt gcacccagtc ccttctctcc 



ccgccccgcc ccccgcgccc cgccccctgc 28500 
cggggccggg gaggggaggg ggagacggag 28560 
acggtggggg aacggtgcgg ggtgcgaaag 28620 
aggggtgcgc gggagggcga cagcggcgtg 28680 
gaaatggagg gtgttgggtg agggtgctgc 2 8740 
cggagttgct ggcatgcagg gtgcttgcgc 2 8 800 
tggaggctgt gcgagggtgg gggcgcgggc 28860 
gcgtggccag cgtgacgggg gagcgtaagg 28920 
gagaggcgtg ctgcgggcag gtgggtgtct 28980 
accgggacag gggaggctgc agctggaggt 2 9040 
ggatctccca gggcagggcg aggctggggc 2910 0 
tccctctctc ctgtcctgac ctgaaaaccc 29160 
cccctgaaag tgaactaact ggaaggaagc 2922 0 
cctgtgaaca ccttccaagc cctggcgtcc 29280 
cctctctccc tctctctgca tgtatttgcc 29340 
gtgactcacc cctccagact taggtccctt 29400 
cacttctgtg acaccctgta gacctgatgc 2 9460 
tgagaaacca tggaaagaag gcctcgacct 2 952 0 
gtccagaagt gccaattatg aacatctttc 29580 
gagtctcgct ctgttgccca ggctggagtg 29640 
ctgcctccca ggttccagtg attctcctgc 29700 
cgcccgccac catgcctagc taatttttat 29760 
tggccaggct ggtcttgaac tccttacctc 29820 
gctggattac aggcgtgagc caccatgcct 2 9880 
aaaaaatttt acatccagtc ccacaaggga 2 9940 
gtacccagct cccagtatcc tttctgacct 30000 
cccaggacca tggctcccag tgtcttctct 3 0060 
tgtgtcctca ggaccacggc tcccagcatc 3 012 0 
aacccctgtg aagcaggacc atggctccca 3 0180 
ctatcaactc ctgtgtcccc aggacgatgg 30240 
aagcttctaa ctgcccctgt gtccccagat 30300 
agtcctcagc ttcccagctt ctgtagactt 30360 
gggctcacat tctgtgactt ttgctagatg 30420 
actggtccaa ggggtaacta gtagttgcct 3 04 80 
tctgtgctct gacagatgtc tcctgctcca 30540 
tggttctcac ctgtcatcct taagtcccac 30600 
ggtcctgacg ggcgcgttgg ctcacacctg 3 0660 
gccgatcact tgaggtcagg agtttgagac 30720 
caccatcttt accaaaaaaa aaaaaaaaaa 30780 
tcccagctgg tcggaaggct gaggcatgag 30840 
agtgagctaa gatcatgcca ctgcactcca 30900 
ataataataa taataataat aataataata 30960 
tccccatcct acttcagggt accctgtcca 31020 
caacccaact ggtttgagag aaagagaact 310 8 0 
gctggctttg gcgaggtctg tcaatctctg 3114 0 
caagatggct ggcagatacc cctggggcca 31200 
aagagagaga caacctttat ttcacacagc 31260 
tcggagacct agctcttgcc tggtttctaa 31320 
agcacaaaca gattttattt cttgcaagca 31380 
taacaatgag gtcctgatca caagctatgg 3144 0 
caatatctgc tggagggcat catggaataa 31500 
gcatcatggg atatataatc ctaaccttca 31560 
agtcctagcc tcaatatgtt gtagggaatt 31620 
atacagagca tctcagaaaa tgtcgtttta 31680 
gatatacttc tggcccaatt tttgttgtaa 31740 
ttcccttttt tcttttcttt ctttctttct 31800 
gtctctcgct atgttgccca ggctggtcct 31860 
ttggcctccc aaagtgctgg gattacaggc 3192 0 
tttctttctt catcacctgc catattccag 31980 
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gcactaggaa taaatcatca agtaaataaa cggccttacc ctccctggca attataatgg 32040 

ggaaagttag ctaaaaacaa acaaaaatta ctgttccatt taaccatcgc tgaataacaa 32100 

aataccccag aacgtagtgg tgtgaaacaa caacctttta attttatgat tctgtgagtc 32160 

aggaattgga gcaggattgg tgtgtatctg cttcatgatg aactggagcc aaaaatgaac 32220 

tagctggaac agctggagat ggaggggagg ggcatcaagg gccatatatc taaggctggt 3 22 80 

ggttggtgtt gtgggttttg aatagtgtcc tccaagtaaa atatatgttg aagttctagc 32340 

ccctggtatc tgtacatgtg accttatttg gaaataaaat ctttgcaaat gtaattcact 32400 

tttttgtttg tttgtttgtt tgctcgagac tgagtctcgc tctgtcaccc aggctggagt 32460 

gcagtggcat gatctcggct cactgtaacc ttcacctcct gggttcaagc gattctcctg 32520 

cctcagcctc ccaagtagct gggattatag gcacgtgtca ccatgcccag ctaatttttg 32580 

tattttcagt agggacgggg tttcaccatg ttggccaggc tggtctcgaa ctcctgacct 32640 

caaatgatct gccacctcag cctcccaaag tgctgggatt ataggcatgg ggcactgcat 32700 

cctgcccaga tgtgattaac ttctaacccc tggtatcttt gcatgtgact ttatttggaa 32760 

ataaggtggg tttttttctt gttttttttt ttttttttga gacagtttca ctttgtcgct 32820 

caggctggag ttcagttgca taatctcagc tcactgaaac ctctgcctcc gaggctcaag 3 2880 

cgatcctccc gcctcagtct cccgagtcac tgggactacg ggcaagcgcc accacacccg 32940 

gctaattgtt gcagtttttg tagagatggg gttttgccat gttgcccagg cggtctccaa 33000 

ttgccaccct caagcaattc atccgcctcg gcctcccaga gtgctggaat tataggtgtg 33060 

agccatggcg cccggccaga aagtctttgc agatttagtt gaattaatga ctaaatgttt 33120 

ccatgctgag ttagagtggg ctctaaatcc aatgattgat atggggttat aaggagagat 33180 

atttggagac atagccacag tcccagggaa ggtggacatt ggaagacaga ggtagggatt 33240 

agagtgatgc agctacaagc caaggaatgg caaagattgc tggcagtccc tcagaagcaa 33300 

aggagaggca aggaagggtt cttcccctga gacttttttt tttttttttg agacggagtc 333 60 

tcactgctgt cagcctcagc tggagtgcaa tggcgcgatc tcggctcact gcaacctctg 33420 

cctcccaggt tccagcaatt ctcctgcctc agcctcccga gtaactgaga ttacaggcac 334 80 

ccgccaccat gcctggctag tttttgcatt tttagtagag atgggatttc accctgttgg 33540 

ccaggctggt ctcgaactcc tgacctcagg tgatccaccc gcctcggcct cccaaagtgc 33600 

tgggattaca ggtgtcagcc ccggagactt taaaagcatg gctcttcccc tgacgcttta 33660 

aaagcgtggc tcttcccgtg agacttcaac accttggttt tggacattta gcattcagaa 33720 

ctgtgagaga acaagtttct agtgtgtgtg tgtgtgtgtg tgtgtgtgtg tgtgtgtgtg 33780 

tgtgtgtgta tgtgttttag acagaggctc attctgttgc ccaggctgga gtgcagtggt 33 840 

tcaatctcgg ctcactgcaa actccgcttc tcagattcaa gtgattctta tgcctcagcc 33900 

tcccaagtag ctggaattac agaggagcgc catcacagcc ggctattttt tttttttttt 33 960 

tttgtacttt tagtagagac agggtttcac tgtgttggcc aggctggtct caaattcctg 34020 

gcctcaagtg atatgcctgc cttggcctcc caaagtgctg ggattacagg tgtaagccac 34080 

cacacctggc ctaagtttct gtgtgtgtgt gtgtgtgttt tgttttgttt tttttttttt 34140 

tttgagtgga gtctcgctct gttgcccagg ctggagtgca gtggcatgat ctcgactcac 342 00 

tgcaagctcc gcctcccggg ttcacgccat tctcctgcct cagcctcccg agtagctggg 34260 

actacaggca cccaccacca cgcccagtta attttttgta tttttaatag tgacagggtt 343 20 

tcatcatgtt agccaggatg gtctcgatct cctgacctcg tgatccgccc gcctcagcct 343 80 

cccgaattgc tgggattaca ggcatgagcc accaaacccg gccaagtttc tgtggtttta 34440 

agccaccttg cttgtaagat ttgtgtgtgt gtgtttttaa ttttttattt ttaagtatta 34500 

tgaatacata atagtggtgt atatttacag gacatatgta atatggtttt gggttttagt 34560 

gttttttttt tggagacaga gtctggctct gttgcccagg ctggagtaca gtggtgggat 34620 

catggctcac tgcagccttg acctcccggg ctcaagggat cctcctgcct cagcctccca 34680 

tgtaactagg accacaggca tgccccacca catccagcca attttttttt atttttagtg 34740 

gagatgaggt ctcactgtgt tgcccaggct gatcttgaac tcctgagctc aagagatctt 34 800 

cctttctcac cctcccaaag tgctaggact acaggcatga gccactgtgc ctgtccttcc 34860 

atgatgtttt gatataggca cacaatgtgt tagtttataa agtttgtaat aatttatcac 34 920 

aggcagccct aggaaactaa tatagccaag tttcctgttt cttctctata tcacatctgc 34980 

tggggctaca tgtccaaggt ggcttcttca cccacttgtc tggtgcctgg gctgagatgg 3 504 0 

ctgaaacatc tggggctcta tctccacatg gcatttatac atgagtagct tgggcttcct 3 5100 

cacagcatgg tggtctcagg gcagtagtac ttttacatgg caaccagctt ccccagagtg 35160 

agcgttctaa gattcagaaa gtgaaaaatg aaagtttctt aaaacttggt tccagaacat 35220 

agcacagcaa aacttccacc acattctact ggtcaaagca gtcacagagt cactcatatt 35280 

caagaggcag aagtacagac ctcacttctt taagccacta cagtgacagg tggtgatatg 3 5340 

tcattagaga aagccctaaa caagaacctt gtccctcacc tgcccccaaa taccatggaa 3 54 00 

gatgtctttt tttttttttt tttttttttg gggatagtct cactgtgtca tgcagtggtg 35460 
tgatc 35465 
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<210> 57 
<211> 14327 
<212> ADN 

<213> Homo sapiens 
<400> 57 

ggccggcgag cgggcggctg cgggcggcgc ggagcgggcg gcgcggagcg agcgagcgag 6 0 
agagcggcgc gggccgggcc atggggtggc gggcgccggg cgcgctgctg ctggcgctgc 12 0 
tgctgcacgg gcggctgctg gcggtgaccc atgggctgag ggcatacgat ggcttgtctc 180 
tgcctgagga catagagacc gtcacagcaa gccaaatgcg ctggacacat tcgtaccttt 24 0 
ctgatgatga gtacatgctg gctgacagca tctcaggaga cgacctgggc agtggggacc 3 00 
tgggcagcgg ggacttccag atggtttatt tccgagccct ggtgaatttc actcgctcca 3 60 
tcgagtacag ccctcagctg gaggatgcag gctccagaga gtttcgagag gtgtccgagg 420 
ctgtggtaga cacgctggag tcggagtact tgaaaattcc cggagaccag gttgtcagtg 4 80 
tggtgttcat caaggagctg gatggctggg tttttgtgga gctcgatgtg ggctcggaag 54 0 
ggaatgcgga tggtgctcag attcaggaga tgctgctcag ggtcatctcc agcggctctg 600 
tggcctccta cgtcacctct ccccagggat tccagttccg acgcctgggc acagtgcccc 660 
agttcccaag agcctgcacg gaggccgagt ttgcctgcca cagctacaat gagtgtgtgg 720 
ccctggagta tcgctgtgac cggcggcccg actgcaggga catgtctgat gagctcaatt 780 
gtgaggagcc agtcctgggt atcagcccca cattctctct ccttgtggag acgacatctt S4 0 
taccgccccg gccagagaca accatcatgc gacagccacc agtcacccac gctcctcagc 900 
ccctgcttcc cggttccgtc aggcccctgc cctgtgggcc ccaggaggcc gcatgccgca 960 
atgggcactg catccccaga gactacctct gcgacggaca ggaggactgc gaggacggca 1020 
gcgatgagct agactgtggc cccccgccac cctgtgagcc caacgagttc ccctgcggga 1080 
atggacattg tgccctcaag ctgtggcgct gcgatggtga ctttgactgt gaggaccgaa 1140 
ctgatgaagc caactgcccc accaagcgtc ctgaggaagt gtgcgggccc acacagttcc 1200 
gatgcgtctc taccaacatg tgcatcccag ccagcttcca ctgtgacgag gagagcgact 1260 
gtcctgaccg gagcgacgag tttggctgca tgccccccca ggtggtgaca cctccccggg 132 0 
agtccatcca ggcttcccgg ggccagacag tgaccttcac ctgcgtggcc attggcgtcc 1380 
ccacccccat catcaattgg aggctcaact ggggccacat cccctctcat cccagggtga 1440 
cagtgaccag cgagggtggc cgtggcacac tgatcatccg tgatgtgaag gagtcagacc 1500 
«^9ggtgccta cacctgtgag gccatgaacg cccggggcat ggtgtttggc attcctgacg 1560 
gtgtccttga gctcgtccca caacgaggcc cctgccctga cggccacttc tacctggagc 1620 
acagcgccgc ctgcctgccc tgcttctgct ttggcatcac cagcgtgtgc cagagcaccc 1680 
gccgcttccg ggaccagatc aggctgcgct ttgaccaacc cgatgacttc aagggtgtga 1740 
atgtgacaat gcctgcgcag cccggcacgc cacccctctc ctccacgcag ctgcagatcg 1800 
acccatccct gcacgagttc cagctagtag acctgtcccg ccgcttcctc gtccacgact 1860 
ccttctgggc tctgcctgaa cagttcctgg gcaacaaggt ggactcctat ggcggctccc 1920 
tgcgttacaa cgtgcgctac gagttggccc gtggcatgct ggagccagtg cagcggccgg 1980 
acgtggtcct cgtgggtgcc gggtaccgcc tcctctcccg aggccacaca cccacccaac 2040 
ctggtgctct gaaccagcgc caggtccagt tctctgagga gcactgggtc catgagtctg 2100 
gccggccggt gcagcgcgcg gagctgctgc aggtgctgca gagcctggag gccgtgctca 2160 
tccagaccgt gtacaacacc aagatggcta gcgtgggact tagcgacatc gccatggata 2220 
ccaccgtcac ccatgccacc agccatggcc gtgcccacag tgtggaggag tgcagatgcc 22 80 
ccattggcca ttctggcttg tcctgcgaga gctgtgatgc ccacttcact cgggtgcctg 2340 
gtgggcccta cctgggcacc tgctctggtt gcagttgcaa tggccatgcc agctcctgtg 2400 
accctgtgta tggccactgc ctgaattgcc agcacaacac ggaggggcca cagtgcaaca 2460 
agtgcaaggc tggcttcttt ggggacgcca tgaaggccac ggccacttcc tgccggccct 2 520 
gcccttgccc atacatcgat gcctcccgca gattctcaga cacttgcttc ctggacacgg 2580 
atggccaagc cacatgtgac gcctgtgccc caggctacac tggccgccgc tgtgagagct 2 640 
gtgcccccgg atacgagggc aaccccatcc agcccggcgg gaagtgcagg cccgtcaacc 2700 
aggagattgt gcgctgtgac gagcgtggca gcatggggac ctccggggag gcctgccgct 2 760 
gtaagaacaa tgtggtgggg cgcttgtgca atgaatgtgc tgacggctct ttccacctga 2820 
gtacccgaaa ccccgatggc tgcctcaagt gcttctgcat gggtgtcagt cgccactgca 2880 
ccagctcttc atggagccgt gcccagttgc atggggcctc tgaggagcct ggtcacttca 2 940 
gcctgaccaa cgccgcaagc acccacacca ccaacgaggg catcttctcc cccacgcccg 3000 
gggaactggg attctcctcc ttccacagac tcttatctgg accctacttc tggagcctcc 3 060 
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cttcacgctt cctgggggac aaggtgacct 
cccagaggtc ccagccgggc tccacacccc 
gtaacaacat catcctagag caccatgtgg 
ccttcattgt gcctttccgg gagcaagcat 
gggagcacct gctgatggca ctggcaggca 
cccagcagcc cgctgagagc agggtctctg 
aaaccggcca ggaccccgcg ctggaagtgg 
ggccgtcctg ccaggactgt gacacaggct 
gtacctgtga acgctgcagc tgccatggcc 
cctgccaggg ctgccagcat cacacggagg 
actacgggga cgcccagcgg gggacaccac 
accctgctgc cggccaggct gcccacactt 
gtgatgcgtg ctccccaggc cacagtgggc 
atggcaaccc cagccagggc cagccatgcc 
gctgcaactg tgacccccaa ggcagcgtca 
agtgcaaggc ccaggtagaa ggcctcactt 
tgagtgccag caacccagac ggctgcctgc 
gcgccagctc tgcctacaca cgccacctga 
aaggctttgc cctggtgaac ccacagcgaa 
aacccgtgcc cgagggtgcc cagctctctt 
ccttctactg gcagctgccg gagacatacc 
agttgcgata caccctctcc tacacagcag 
atgtgcagat cacgggcaac aacatcatgc 
cagagaggag gagctacgag atcatgttcc 
agccggccac acgcgagcac ctcctgatgg 
gggccacgtt ctcctccgtg ccgctggtgg 
cccagccggg gccctcaaac agaccccgcg 
caggctacat cggtctgtcc tgccaggact 
ggctctacct cggccactgc gagctatgtg 
cagagactgg ggcctgctcg caatgccagc 
gtgcccctgg ctactacgga gatgccacag 
cctgcccact gaccaaccca gagaacatgt 
gcgggtaccg ctgcacggcc tgcgaacccg 
gcccaggtta cgtgggtaac cccagtgtgc 
aagccccact ggtggtcgag gtccatcctg 
actccctgcg gtgtcaggtc agtgggagcc 
atgggcggcc tgtgcccagc ggcacccagc 
ccagcgtcca gccctcggat gctggggtct 
ccaataccag ccgggcagag ctgctggtca 
ctgtggagga gcagcggagc cagagcgtgc 
cagccaaaag caagtcccca gcctataccc 
tgcccacccg agccatggat ttcaatggca 
atgcaggcac ctacgtgtgc accggctcca 
ctctacatgt gcaggcctcg ggcaccttgt 
agctcacagt gcagcccggg caactggcgg 
cgcccaccct cgagtggaca gggggccccg 
acggcggcat cctgcgcctg ccagctgtcg 
gagcccacag cagcgctggg cagcaggtgg 
gtgggcccag agtccaagtg agcccagaga 
ggctgtactg cagggctgca ggcgtgccta 
gcagcctccc accacaggcc cggtcagagc 
ccatcacgac tgctgacgcc ggcttctacc 
cccaggcccg gatgcaagtg gttgtccttt 
agattgagtc ctcatcgcct tctgtgacag 
tggcagggtc agcccatgcc caggtcacct 
acacccaggt gcacggctcc cgtctgcggc 
aatatgtgtg ccgtgtggag aatggatcgg 
tgctccacgg cacccattct ggccccagct 
tccgcatcga gccctcctcc tcacacgtgg 



cctatggagg agagctgcgc ttcacagtga 3120 
tgcacgggca gccgttggtg gtgctgcaag 3180 
cccaggagcc cagccccggc cagcccagca 3240 
ggcagcggcc cgatgggcag ccagccacac 3 3 00 
tcgacaccct cctgatccga gcatcctacg 3 3 60 
gcatcagcat ggacgtggct gtgcccgagg 3420 
aacagtgctc ctgcccaccc gggtaccgtg 3480 
acacacgcac gcccagtggc ctctacctgg 3 540 
actcagaggc ctgcgagcca gaaacaggtg 3 600 
gccctcggtg tgagcagtgc cagccaggat 3 6 60 
aggactgcca gctgtgcccc tgctacggag 3 72 0 
gttttctgga cacagacggc caccccacct 3780 
gtcactgtga gaggtgcgcc cctggctact 3 840 
agagagacag ccaggtgcca gggcccatag 3 900 
gcagccagtg tgatgctgct ggtcagtgcc 3 960 
gcagccactg ccggccccac cacttccacc 4020 
cctgcttctg tatgggcatc acccagcagt 4 080 
tctccaccca ctttgcccct ggggacttcc 4140 
acagccgcct gacaggagaa ttcactgtgg 4200 
ttggcaactt tgcccaactc ggccatgagt 4260 
agggagacaa ggtggcggcc tacggtggga 432 0 
gcccacaggg cagcccactc tcggaccccg 4380 
tagtggcctc ccagccagcg ctgcagggcc 444 0 
gagaggaatt ctggcgccgg cccgatgggc 4 50 0 
cactggccga cctggatgag ctcctgatcc 4 560 
ccagcatcag cgcagtcagc ctggaggtcg 462 0 
ccctcgaggt ggaggagtgc cgctgcccgc 4680 
gtgcccccgg ctacacgcgc accgggagtg 4 74 0 
aatgcaatgg ccactcagac ctgtgccacc 4800 
acaacgccgc aggggagttc tgcgagcttt 4 860 
ccgggacgcc tgaggactgc cagccctgtg 492 0 
tttcccgcac ctgtgagagc ctgggagccg 4980 
gctacactgg ccagtactgt gagcagtgtg 504 0 
aagggggcca gtgcctgcca gagacaaacc 5100 
ctcgaagcat agtgccccaa ggtggctccc 5160 
caccccacta cttctattgg tcccgtgagg 522 0 
agcgacatca aggctccgag ctccacttcc 5280 
acatttgcac ctgccgtaat ctccaccaat 5340 
ctgaggctcc aagcaagccc atcacagtga 5400 
gccccggagc tgacgtcacc ttcatctgca 5460 
tggtgtggac ccgcctgcac aacgggaaac 552 0 
tcctgaccat tcgcaacgtc cagctgagtg 5580 
acatgtttgc catggaccag ggcacagcca 564 0 
ccgcccccgt ggtctccatc catccgccac 5700 
agttccgctg cagcgccaca gggagcccca 5760 
gcggccagct ccctgcgaag gcacaaatcc 582 0 
agcccacgga tcaggcccag tacttgtgcc 5880 
ccagggctgt gctccacgtg catgggggcg 5940 
ggacccaggt ccacgcaggc cggaccgtca 6000 
gcgccaccat cacctggagg aaggaagggg 6060 
gcacagacat cgcgacactg ctcatcccag 6120 
tctgcgtggc caccagccct gcaggcactg 6180 
cagcctcaga tgccagccca ccgggggtca 624 0 
aagggcaaac actcgacctc aactgtgtgg 6300 
ggtacaggcg agggggtagc ctgcctcccc 6360 
tcccccaggt ctcaccagct gattctggag 642 0 
gccccaagga ggcctccatt actgtgtctg 64 8 0 
acaccccagt gcccggcagc acccggccca 654 0 
cggaagggca gaccctggat ctgaactgcg 6600 
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tggtgcccgg gcaggcccac gcccaggtca 
cccggcacca gacccacggc tcgctgctgc 
gcgagtatgt gtgccatgtg gtgggcacct 
ccatcgaagc ctctgtcatc cctggaccca 
ccacagtggc cgagggccag accctggatc 
cccaggtcac atggtacaag cgtgggggca 
cccgcctgta catcttccag gcctcacctg 
gcaacggcat ggaggcctcc atcacggtca 
cctaccctgc cggcagcacc cagcccatcc 
aagggcagac cctggatctg aactgcgtgg 
ggcacaagcg tgggggcagc ctccctgtcc 
tctaccaagc gtcccccgcc gactcgggcg 
tgcctctaga ggcctctgtc ctggtcacca 
gggtcacccc cacggtccgg atcgagtcat 
tggacctgaa ctgcctcgtt gctggtcagg 
ggggcagcct cccggcccgg caccaggtgc 
ccccagctga ttcaggggag tacgtgtgcc 
cctcagtcct tgtcaccatc cagcagcgcc 
accccgtccg catcgagtcc tcctcagcct 
actgcctggt tgccagccag gctccccaca 
tacccagccg gcaccagatc gtgggctccc 
actcgggcga gtacgtgtgt cacgtcagta 
tcgtcaccat ccagggcagc ggttcctccc 
tcgagtcgtc ttcccccacg gtggtggaag 
ccaggcagcc ccaggctatc atcacatggt 
accagaccca tggctcccac ctgcggttgc 
atgtgtgccg ggccaacaac aacatcgatg 
cccctagcgc cggcagcccc tccgcccctg 
cctcctcaca cgtggccgaa ggggagaccc 
cccatgccca ggtcacttgg cacaagcgtg 
gcggctcacg gctgcggctg caccatgtgt 
gggtgatggg cagctctggc cccctggagg 
gctcaagtgc tgtccacgtc cccgccccag 
cctcctcccg agtggcagaa gggcagaccc 
cccacgccca ggtcacatgg cacaagcgtg 
acggcccact gctgaggctg aaccaggtgt 
aagtgaccgg aagctcaggc accctggagg 
gcccaggacc cattcctgct ccaggactgg 
cacacgtgac tgaagggcag actctggatc 
cccaggtcac gtggtacaag cgcgggggca 
cccagctgcg gctccacctc gtctcccctg 
ccagcggccc aggccctgag caagaagcct 
ggtcttccta ccgccttagg agcccggtca 
agcagggcca ggatgccagc ttcaagtgcc 
tcgagtggaa gacccggaac caggagctgg 
ccatcatcac catcgtgggc acccggccca 
ccaatgccta cggtgtggcc cagagtgtgg 
tgtccgtgct ccccgagggc cccgtgtggg 
gtgtcagtgc cggggagccc cgctcctctg 
ccaagttgga gcagcggaca tatgggctca 
cagctaaacc atcagatgcg ggcacttatg 
cacagaagca ggtggaggtg atcgtggaca 
tccaagctga agaagctgag ctgactgtgg 
cagccacagg cagccccgcg cccaccatcc 
ggcagcaccg gctggaaggt gacacactca 
gccagtacat ctgcaatgcc actagccctg 
acgtggagag cccaccatat gccaccacgg 
agacggtgca gctccagtgc ctggctcacg 
gcgtgggcag cagccttcct gggagggcga 




cgtggcacaa gcgtgggggc agcctccctg 6660 
ggctgcacca ggtgaccccg gccgactcag 6720 
ccggccccct agaggcctca gtcctggtca 6780 
tcccacctgt caggatcgag tcttcatcct 6840 
tgagctgcgt ggtggcaggg caggcccacg 6900 
gcctccctgc ccggcaccag gttcgtggct 6960 
ccgatgcggg acagtacgtc tgccgggcca 7020 
cagtaactgg gacccagggg gccaacttag 7080 
gcatcgagcc ctcctcctcg caagtggcgg 7140 
tgcccgggca gtcccatgcc caggtcacgt 7200 
ggcaccagac ccacggctcc ctgctgagac 7260 
agtacgtgtg ccgagtgttg ggcagctccg 7320 
ttgagcctgc gggctcagtg cctgcacttg 7380 
cgtcttcgca agtggccgag gggcagaccc 7440 
cccatgccca ggtcacgtgg cacaagcgcg 7 500 
atggctcgag gctacgcctg ctccaggtga 7560 
gtgtggtcgg cagctcaggt acccaggaag 7620 
ttagtggctc ccactcccag ggtgtggcgt 7680 
ccctggccaa tggacacacc ctggacctca 774 0 
ccatcacctg gtataagcgt ggaggcagct 7 800 
ggctgcggat ccctcaggtg actccggcag 7860 
acggtgcagg ctcccgggag acctcgctca 7920 
acgtgcccag cgtctcccca ccgatcagga 7980 
ggcagacctt ggatctgaac tgcgtggtcg 8040 
acaagcgtgg gggcagcctt ccctcccgac 8100 
accaaatgtc tgtggctgac tcgggcgagt 8160 
ccctggaggc ctccatcgtc atctccgtct 8220 
gcagctccat gcccatcaga attgagtcat 8280 
tggatctgaa ctgcgtggtc cccgggcagg 8340 
ggggcagcct ccccagtcac catcagaccc 8400 
ccccggccga ctcgggtgaa tacgtgtgcc 8460 
cctcagtcct ggtcaccatc gaagcctctg 8520 
gtggagcccc acccatccgc atcgagccct 8580 
tggatctgaa gtgcgtggtg cccgggcagg 8640 
gaggaaacct ccctgcccgg caccaggtcc 8700 
ccccggctga ctctggcgag tactcgtgcc 8760 
catctgtcct ggtcacaatt gagccctcca 8820 
cccagcccat ctacatcgag gcctcctctt 8880 
tgaactgtgt ggtgcccggg caggcccatg 894 0 
gcctccccgc ccggcaccag acccatggct 9000 
ccgactcagg cgagtatgtg tgtcgtgcag 9060 
ccttcacagt caccgtcccg cccagtgagg 9120 
tctccatcga cccgcccagc agcaccgtgc 9180 
tcatccatga cggggcagcc cccatcagcc 924 0 
aggacaacgt ccacatcagt cccaatggct 93 00 
gcaaccacgg tacctaccgc tgcgtggcct 9360 
tgaacctcag tgtgcacggg ccccccacag 9420 
tgaaagtggg aaaggctgtc accctggagt 9480 
ctcgttggac ccggatcagc agcacccctg 954 0 
tggacagcca cgcggtgctg cagatttcat 9600 
tgtgccttgc tcagaatgca ctaggcacag 9660 
cgggcgccat ggccccaggg gcccctcagg 9720 
aggctggaca cacggccacc ttgcgctgct 9780 
actggtccaa gctgcgttcc ccactgccct 9840 
tcataccccg ggtagcccag caggactcgg 9900 
ctgggcacgc tgaggccacc atcatcctgc 9960 
tcccagagca cgcttcggtg caggcagggg 10 020 
ggacaccccc actcaccttc cagtggagcc 10 080 
ccgccaggaa cgagctgctg cactttgagc 10140 
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gtgcagcccc tgaggactca ggccgctacc gctgccgggt caccaacaag gtgggctcag 10200 
ccgaggcctt tgcccagctg ctcgtccaag gccctcccgg ctctctccct gccacctcca 10260 
tcccagcagg gtccacgccc accgtgcagg tcacgcctca gctagagacc aagagcattg 1032 0 
gggccagcgt tgagttccac tgtgctgtgc ccagcgacca gggtacccag ctccgttggt 103 80 
tcaaggaagg gggtcagctg cctccgggtc acagcgtgca ggatggggtg ctccgaatcc 10440 
agaacttgga ccagagctgc caagggacgt atatatgcca ggcccatgga ccttggggga 10500 
aggcccaggc cagtgcccag ctggttatcc aagccctgcc ctcggtgctc atcaacatcc 10560 
ggacctctgt gcagaccgtg gtggttggcc acgccgtgga gttcgaatgc ctggcactgg 10620 
gtgaccccaa gcctcaggtg acatggagca aagttggagg gcacctgcgg ccaggcattg 10680 
tgcagagcgg aggtgtcgtc aggatcgccc acgtagagct ggctgatgcg ggacagtatc 10740 
gctgcactgc caccaacgca gctggcacca cacaatccca cgtcctgctg cttgtgcaag 10800 
ccttgcccca gatctcaatg ccccaagaag tccgtgtgcc tgctggttct gcagctgtct 10860 
tcccctgcat agcctcaggc taccccactc ctgacatcag ctggagcaag ctggatggca 1092 0 
gcctgccacc tgacagccgc ctggagaaca acatgctgat gctgccctca gtccgacccc 10980 
aggacgcagg tacctacgtc tgcaccgcca ctaaccgcca gggcaaggtc aaagcctttg 11040 
cccacctgca ggtgccagag cgggtggtgc cctacttcac gcagaccccc tactccttcc 11100 
taccgctgcc caccatcaag gatgcctaca ggaagttcga gatcaagatc accttccggc 11160 
ccgactcagc cgatgggatg ctgctgtaca atgggcagaa gcgagtccca gggagcccca 112 2 0 
ccaacctggc caaccggcag cccgacttca tctccttcgg cctcgtgggg ggaaggcccg 112 80 
agttccggtt cgatgcaggc tcaggcatgg ccaccatccg ccatcccaca ccactggccc 11340 
tgggccattt ccacaccgtg accctgctgc gcagcctcac ccagggctcc ctgattgtgg 11400 
gtgacctggc cccggtcaat gggacctccc agggcaagtt ccagggcctg gatctgaacg 114 60 
aggaactcta cctgggtggc tatcctgact atggtgccat ccccaaggcg gggctgagca 11520 
gcggcttcat aggctgtgtc cgggagctgc gcatccaggg cgaggagatc gtcttccatg 115 80 
acctcaacct cacggcgcac ggcatctccc actgccccac ctgtcgggac cggccctgcc 11640 
agaatggcgg tcagtgccat gactctgaga gcagcagcta cgtgtgcgtc tgcccagctg 11700 
gcttcaccgg gagccgctgt gagcactcgc aggccctgca ctgccatcca gaggcctgtg 11760 
ggcccgacgc cacctgtgtg aaccggcctg acggtcgagg ctacacctgc cgctgccacc 11820 
tgggccgctc ggggttgcgg tgtgaggaag gtgtgacagt gaccaccccc tcgctgtcgg 118 80 
gtgctggctc ctacctggca ctgcccgccc tcaccaacac acaccacgag ctacgcctgg 11940 
acgtggagtt caagccactc gcccctgacg gggtcctgct gttcagcggg gggaagagcg 12000 
ggcctgtgga ggacttcgtg tccctggcga tggtgggcgg ccacctggag ttccgctatg 12 060 
agttggggtc agggctggcc gttctgcgga gcgccgagcc gctggccctg ggccgctggc 12120 
accgtgtgtc tgcagagcgt ctcaacaagg acggcagcct gcgggtgaat ggtggacgcc 12180 
ctgtgctgcg ctcctcgccc ggcaagagcc agggcctcaa cctgcacacc ctgctctacc 12240 
tggggggtgt ggagccttcc gtgccactgt ccccggccac caacatgagc gctcacttcc 123 00 
gcggctgtgt gggcgaggtg tcagtgaatg gcaaacggct ggacctcacc tacagtttcc 12360 
taggcagcca gggcatcggg caatgctatg atagctcccc atgtgagcgc cagccttgcc 12420 
aacatggtgc cacgtgcatg cccgctggcg agtatgagtt ccagtgcctg tgtcgagatg 124 80 
gattcaaagg agacctgtgt gagcacgagg agaacccctg ccagctccgt gaaccctgtc 12540 
tgcatggggg cacctgccag ggcacccgct gcctctgcct ccctggcttc tctggcccac 12600 
gctgccaaca aggctctgga catggcatag cagagtccga ctggcatctt gaaggcagcg 12660 
ggggcaatga tgcccctggg cagtacggag cctatttcca cgatgatggc ttcctcgcct 12720 
tccctggcca tgtcttctcc aggagcctgc ccgaggtgcc cgagaccatc gagctggagg 127 80 
ttcggaccag cacagccagt ggcctcctgc tctggcaggg tgtggaggtg ggagaggccg 12840 
gccaaggcaa ggacttcatc agcctcgggc ttcaagacgg gcaccttgtc ttcaggtacc 12900 
agctgggtag tggggaggcc cgcctggtct ctgaggaccc catcaatgac ggcgagtggc 12960 
accgggtgac agcactgcgg gagggccgca gaggttccat ccaagtcgac ggtgaggagc 13020 
tggtcagcgg ccggtcccca ggtcccaacg tggcagtcaa cgccaagggc agcgtctaca 13 0 80 
tcggcggagc ccctgacgtg gccacgctga ccgggggcag attctcctcg ggcatcacag 13140 
gctgtgtcaa gaacctggtg ctgcactcgg cccgacccgg cgccccgccc ccacagcccc 132 00 
tggacctgca gcaccgcgcc caggccgggg ccaacacacg cccctgcccc tcgtaggcac 132 60 
ctgcctgccc cacacggact cccgggccac gccccagccc gacaatgtcg agtatattat 13320 
tattaatatt attatgaatt tttgtaagaa accgaggcga tgccacgctt tgctgctacc 13380 
gccctgggct ggactggagg tgggcatgcc accctcacac acacagctgg gcaaagccac 13 440 
aaggctggcc agcaaggcag gttggatggg agtgggcacc tcagaaagtc accaggactt 13500 
ggggtcagga acagtggctg ggtgggccca gaactgcccc cactgtcccc ctacccaccg 13560 
atggagcccc cagatagagc tgggtggcct gtttctgcag cccttgggca gttctcactc 13620 
ctaggagagc caacctcggc ttgtgggctg gtgccccaca gctacctgag acgggcatcg 13 680 
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caggagtctc tgccacccac tcaggattgg gaattgtctt tagtgccggc tgtggagcaa 1374 0 
aaggcagctc acccctgggc aggcggtccc catccccacc agctcgtttt tcagcacccc 13800 
cacccacctc cacccagccc ctggcacctc ctctggcaga ctccccctcc taccacgtcc 13860 
tcctggcctg cattcccacc ccctcctgcc agcacacagc ctggggtccc tccctcaggg 13920 
gctgtaaggg aaggcccacc ccaactctta ccaggagctg ctacaggcag agcccagcac 13980 
tgatagggcc ccgcccaccg ggccccgccc accccaggcc acatccccac ccatctggaa 14 040 
gtgaaggccc agggactcct ccaacagaca acggacggac ggatgccgct ggtgctcagg 14100 
aagagctagt gccttaggtg ggggaaggca ggactcacga ctgagagaga gaggaggggg 14160 
atatgaccac cctgccccat ctgcaggagc ctgaagatcc agctcaagtg ccatcctgcc 1422 0 
agtggccccc agactgtggg gttgggacgc ctggcctctg tgtcctagaa gggaccctcc 14280 
tgtggtcttt gtcttgattt ttcttaataa acggtgctat ccccgcc 14327 



<210> 58 
<211> 15 
<212> PRT 

<213> Homo sapiens 

<400> 58 

lie Pro Thr Gly Glu Pro Cys Pro Glu Pro Leu Arg Thr Tyr Gly 
15 10 15 



<210> 59 
<211> 13 
<212> PRT 

<213> Homo sapiens 
<400> 59 

lie Glu Ser Val Leu Ser Ser Ser Gly Lys Arg Leu Gly 
15 10 



<210> 60 
<211> 18 
<212> PRT 

<213> Homo sapiens 

<400> 60 

Ala Thr Pro Ala Gin Ala His Leu Lys Lys Pro Ser Gin Leu Ser Ser 
15 10 15 

Phe Ser 



<210> 61 
<211> 15 
<212> PRT 
<213> Homo 



sapiens 



<400> 61 

Arg lie Gin Ala Met He Pro Lys Gly Ala Leu Arg Val Ala Val 
15 10 15 
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# 

<210> 62 

<211> 15 

<212> PRT 

<213> Homo sapiens 

<400> 62 

Gly lie Cys Gin Cys Leu Ala Glu Arg Tyr Ser Val He Leu Leu 
15 10 15 



<210> 63 

<211> 17 

<212> PRT 

<213> Homo sapiens 

<400> 63 

Glu Lys Met His Glu Gly Asp Glu Gly Pro Gly His His His Lys Pro 
a 5 10 15 

Gly 



<210> 64 

<211> 13 

<212> PRT 

<213> Homo sapiens 

<400> 64 

Asp Leu Gin Asn Phe Leu Lys Lys Glu Asn Lys Asn Glu 
1 5 10 



<210> 65 

<211> 19 

<212> PRT 

<213> Homo sapiens 

<400> 65 

Val Lys Leu Gly His Pro Asp Thr Leu Asn Gin Gly Glu Phe Lys Glu 
1 5 10 15 

Leu Val Arg 



<210> 66 

<211> 48 

<212> ADN 

<213> Homo sapiens 



<400> 66 

ttywsntggg ayaaytgytt ygarggnaar gayccngcng tnathmgn 
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# 



<:210> 67 
<211> 48 
<212> ADN 

<213> Homo sapiens 
<400> 67 

taywsnytnc cnaarwsnga rttygcngtn ccngayytng arytnccn 48 



<210> 68 
<211> 16 
<212> PRT 

<213> Homo sapiens 
<400> 68 

Phe Ser Trp Asp Asn Cys Phe Glu Gly Lys Asp Pro Ala Val lie Arg 
15 10 15 



<210> 69 
<211> 585 
<212> ADN 

<213> Homo sapiens 
<400> 69 

gaygcnccng gncartaygg ngcntaytty 
caygtnttyw snmgnwsnyt nccngargtn 
wsnacngcnw snggnytnyt nytntggcar 
aargayttya thwsnytngg nytncargay 
wsnggngarg cnmgnytngt nwsngargay 
acngcnytnm gngarggnmg nmgnggnwsn 
ggnmgnwsnc cnggnccnaa ygtngcngtn 
gcnccngayg tngcnacnyt nacnggnggn 
aaraayytng tnytncayws ngcnmgnccn 
carcaymgng cncargcngg ngcnaayacn 



caygaygayg gnttyytngc nttyccnggn 60 
ccngaracna thgarytnga rgtnmgnacn 120 
ggngtngarg tnggngargc nggncarggn 180 
ggncayytng tnttymgnta ycarytnggn 24 0 
ccnathaayg ayggngartg gcaymgngtn 3 00 
mgncargtng ayggngarga rytngtnv/sn 360 
aaygcnaarg gnwsngtnta yathggnggn 420 
mgnttywsnw snggnathac nggntgygtn 4 80 
ggngcnccnc cnccncarcc nytngayytn 540 
mgnccntgyc cnwsn 585 



<210> 70 

<211> 597 

<212> ADN 

<213> Homo sapiens 



<400> 70 

atgaartggg 

mgngtnwsnw 

taygcnatgg 

ttywsngtng 

aayaaytggg 

aarttyaara 

tggathgtng 

ytngayggna 

ccnccngarg 

taymgnytna 



tntgggcnyt 
snttymgngt 
cnaaraarga 
aygaracngg 
aygtntgygc 
tgaartaytg 
ayacngayta 
cntgygcnga 
cncaraarat 
thgtncayaa 



nytnytnytn 
naargaraay 
yccngarggn 
ncaratgwsn 
ngayatggtn 
gggngtngcn 
ygayacntay 
ywsntaywsn 
hgtnmgncar 
yggntaytgy 



gcngcntggg 
ttygayaarg 
ytnttyytnc 
gcnacngcna 
ggnacnttya 
wsnttyytnc 
gcngtncart 
ttygtnttyw 
mgncargarg 
gayggnmgnw 



cngcngcnga 
cnmgnttyws 
argayaayat 
arggnmgngt 
cngayacnga 
araarggnaa 
aywsntgymg 
snmgngaycc 
arytntgyyt 
sngarmgnaa 



rmgngaytgy 
nggnacntgg 
hgtngcngar 
nmgnytnytn 
rgayccngcn 
ygaygaycay 
nytnytnaay 
naayggnytn 
ngcnmgncar 
yytnytn 



60 

120 

180 

240 

300 

360 

420 

'480 

540 

597 



<210> 71 
<211> 579 



70 

# 

<212> ADN 

<213> Homo sapiens 

<400> 71 

atgcarwsny tnatgcargc nccnytnytn athgcnytng gnytnytnyt ngcnacnccn 60 

gcncargcnc ayytnaaraa rccnwsncar ytnwsnwsnt tywsntggga yaaytgytty 12 0 

garggnaarg ayccngcngt nathmgnwsn ytnacnytng arccngaycc nathgtngtn 180 

ccnggnaayg tnacnytnws ngtngtnggn wsnacnwsng tnccnytnws nwsnccnytn 24 0 

aargtngayy tngtnytnga raargargtn gcnggnytnt ggathaarat hccntgyacn 3 00 

gaytayathg gnwsntgyac nttygarcay ttytgygayg tnytngayat gytnathccn 360 

acnggngarc cntgyccnga rccnytnmgn acntayggny tnccntgyca ytgyccntty 420 

aargarggna cntaywsnyt nccnaarwsn garttygcng tnccngayyt ngarytnccn 4 80 

wsntggytna cnacnggnaa ytaymgnath garwsngtny tnwsnwsnws nggnaarmgn 54 0 

ytnggntgya thaarathgc ngcnwsnytn aarggnath 579 



<210> 72 
<211> 16 
<212> PRT 

<213> Homo sapiens 



<400> 72 

Tyr Ser Leu Pro Lys Ser Glu Phe Ala Val Pro Asp Leu Glu Leu Pro 
15 10 15 



